Linux离线安装Tesseract
引言:
项目上用到了OCR识别,基于Java语言,大多推荐tess4j,也在代码中成功运用,在Windows服务器上运行正常,但是Linux服务器就有问题,提示未安装组件,网上搜了解决方案,需要手动安装Tesseract,而Tesseract又依托于Leptonica,由于服务器部署在内网,只能基于源码手动安装,前前后后试了十几个版本,终于安装成功,现把安装过程记录如下。
1、检测这些基础组件是否安装
autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel

2、下载Leptonica,我用的是1.82.0,地址:http://www.leptonica.org/download.html

3、安装Leptonica
tar -xzvf leptonica-1.82.0.tar.gz
cd leptonica-1.82.0
./autogen.sh
./configure --prefix=/usr/local/leptonica
make -j 8 && make install
4、Leptonica配置环境变量
vim /etc/profile
添加如下内容:
export LD_LIBRARY_PATH=/usr/local/lib
export LIBLEPT_HEADERSDIR=/usr/local/include
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig

使环境变量生效
source /etc/profile
5、下载Tesseract源码,我用的是5.4.1,地址:https://github.com/tesseract-ocr/tesseract/releases/tag/5.4.1

6、安装Tesseract
tar -xzvf tesseract-5.4.1.tar.gz
cd tesseract-5.4.1
./autogen.sh
./configure --prefix=/usr/local/tesseract
make -j 8 && make install
7、Tesseract配置环境变量
vim /etc/profile
添加如下内容:
PATH=$PATH:/usr/local/tesseract/bin
export TESSDATA_PREFIX=/usr/local/tesseract/share/tessdata
export PATH=$PATH:$TESSDATA_PREFIX

使环境变量生效
source /etc/profile
8、测试是否安装成功
tesseract -v

9、拷贝so文件到Java项目中
/usr/local/tesseract/lib目录下的 “libtesseract.so”和“libtesseract.so.5”

放到项目资源文件下

打包后放至服务器运行。
Done
浙公网安备 33010602011771号