【ocrmypdf】OCR engine does not have language data for the following requested languages

在deepin中ocrmypdf指定语言进行ocr识别时,出现OCR engine does not have language data for the following requested languages

 

有2种可能,一种是你没安装语言数据包,另外一种是输错了

第一种情况

既然是没安装语言数据包,直接安装就好。

以安装简体中文语言数据包为例

打开终端,输入

sudo apt-get install tesseract-ocr-chi-sim

回车安装即可

 

第二种情况

还是以安装简体中文语言数据包为例

你可能输入的是以下的命令

ocrmypdf -l chi-sim test.pdf test-ocr.pdf

你安装的时候语言确实是 chi-sim ,不过这是针对 tesseract-ocr 而言的

ocrmypdf 语言数据包的参数的格式是 chi_sim

注意是下划线 _ ,并非横杠 -

正确的命令应该是

ocrmypdf -l chi_sim test.pdf test-ocr.pdf

其他带横杠的语言数据包以此类推

posted @ 2021-10-08 18:04  水汐音  阅读(301)  评论(0编辑  收藏  举报