【ocrmypdf】OCR engine does not have language data for the following requested languages
在deepin中ocrmypdf指定语言进行ocr识别时,出现OCR engine does not have language data for the following requested languages
有2种可能,一种是你没安装语言数据包,另外一种是输错了
第一种情况
既然是没安装语言数据包,直接安装就好。
以安装简体中文语言数据包为例
打开终端,输入
sudo apt-get install tesseract-ocr-chi-sim
回车安装即可
第二种情况
还是以安装简体中文语言数据包为例
你可能输入的是以下的命令
ocrmypdf -l chi-sim test.pdf test-ocr.pdf
你安装的时候语言确实是 chi-sim ,不过这是针对 tesseract-ocr 而言的
ocrmypdf 语言数据包的参数的格式是 chi_sim
注意是下划线 _ ,并非横杠 -
正确的命令应该是
ocrmypdf -l chi_sim test.pdf test-ocr.pdf
其他带横杠的语言数据包以此类推