Linux离线安装Tesseract

引言:
项目上用到了OCR识别,基于Java语言,大多推荐tess4j,也在代码中成功运用,在Windows服务器上运行正常,但是Linux服务器就有问题,提示未安装组件,网上搜了解决方案,需要手动安装Tesseract,而Tesseract又依托于Leptonica,由于服务器部署在内网,只能基于源码手动安装,前前后后试了十几个版本,终于安装成功,现把安装过程记录如下。

 

1、检测这些基础组件是否安装

autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel

2、下载Leptonica,我用的是1.82.0,地址:http://www.leptonica.org/download.html

3、安装Leptonica

tar -xzvf leptonica-1.82.0.tar.gz
cd leptonica-1.82.0
./autogen.sh
./configure --prefix=/usr/local/leptonica
make  -j 8 && make install

4、Leptonica配置环境变量

vim /etc/profile

添加如下内容:

export LD_LIBRARY_PATH=/usr/local/lib
export LIBLEPT_HEADERSDIR=/usr/local/include
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig

使环境变量生效

source /etc/profile

5、下载Tesseract源码,我用的是5.4.1,地址:https://github.com/tesseract-ocr/tesseract/releases/tag/5.4.1

6、安装Tesseract

tar -xzvf tesseract-5.4.1.tar.gz
cd tesseract-5.4.1
./autogen.sh
./configure --prefix=/usr/local/tesseract
make -j 8 && make install

7、Tesseract配置环境变量

vim /etc/profile

添加如下内容:

PATH=$PATH:/usr/local/tesseract/bin
export TESSDATA_PREFIX=/usr/local/tesseract/share/tessdata
export PATH=$PATH:$TESSDATA_PREFIX

使环境变量生效

source /etc/profile

8、测试是否安装成功

tesseract -v

9、拷贝so文件到Java项目中

/usr/local/tesseract/lib目录下的 “libtesseract.so”和“libtesseract.so.5”

放到项目资源文件下

打包后放至服务器运行。

 

Done

posted @ 2025-04-14 20:04  IT王师傅  阅读(963)  评论(2)    收藏  举报