【ocrmypdf】OCR engine does not have language data for the following requested languages

在deepin中ocrmypdf指定语言进行ocr识别时，出现OCR engine does not have language data for the following requested languages

有2种可能，一种是你没安装语言数据包，另外一种是输错了

既然是没安装语言数据包，直接安装就好。

以安装简体中文语言数据包为例

打开终端，输入

sudo apt-get install tesseract-ocr-chi-sim

回车安装即可

还是以安装简体中文语言数据包为例

你可能输入的是以下的命令

ocrmypdf -l chi-sim test.pdf test-ocr.pdf

你安装的时候语言确实是 chi-sim ，不过这是针对 tesseract-ocr 而言的

ocrmypdf 语言数据包的参数的格式是 chi_sim

注意是下划线 _ ，并非横杠 -

正确的命令应该是

ocrmypdf -l chi_sim test.pdf test-ocr.pdf

其他带横杠的语言数据包以此类推

posted @ 2021-10-08 18:04 水汐音阅读(588) 评论(0) 收藏举报

刷新页面返回顶部