Win11 使用MinGW-w64安装Tesseract开发OCR应用程序
1. 下载安装mysy2
2. 更新软件源
默认的MSYS2 源升级软件或是安装新软件的较慢,这里为了提高速度使用中科大的源
编辑 /etc/pacman.d/mirrorlist.mingw32 ,在文件开头添加:
- Server = http://mirrors.ustc.edu.cn/msys2/mingw/i686
编辑 /etc/pacman.d/mirrorlist.mingw64 ,在文件开头添加:
- Server = http://mirrors.ustc.edu.cn/msys2/mingw/x86_64
编辑 /etc/pacman.d/mirrorlist.msys ,在文件开头添加:
- Server = http://mirrors.ustc.edu.cn/msys2/msys/$arch
(或使用使用清华tuna镜像源,分别修改这三个文件,把“Server = https://mirrors.tuna.tsinghua.edu.cn/msys2/msys/$arch/”放到最前面,保存之。)
3.安装软件
# 安装leptonica 32位
pacman -S mingw-w64-i686-leptonica
# 安装leptonica 64位
pacman -S mingw-w64-x86_64-leptonica
# tesseract 32位
pacman -S mingw-w64-i686-tesseract-ocr
# tesseract 64位
pacman -S mingw-w64-x86_64-tesseract-ocr
4.设置环境变量TESSDATA_PREFIX=E:/Qt6/msys64/mingw64/share/tessdata-main/。
将.....\mingw64\bin添加至系统环境变量Path中,这样在运行应用程序时,不至于发生找不到.dll文件的错误。
5. 卸载软件
pacman -R mingw-w64-i686-tesseract-ocr
pacman -R mingw-w64-i686-leptonica
6.下载软件
下载tesseract训练数据文件:https://github.com/tesseract-ocr/tessdata,解压后拷贝至.....\mingw64\share目录下。
以下操作在编译源代码时使用。
下载tesseract
git clone https://github.com/tesseract-ocr/tesseract.git
下载leptonica
git clone https://github.com/DanBloomberg/leptonica.git
浙公网安备 33010602011771号