使用Google开源tesseract OCR用语言库报allow_blob_division解决方案

在使用语音库时候 遇到报错:allow_blob_division,例如使用chi_sim.traineddata;
在chi_sim.traineddata文件目录下,使用命令行执行:

combine_tessdata -e chi_sim.traineddata chi_sim.config

执行完后,在目录下出现chi_sim.config的文件,打开该文件;
在allow_blob_division        F这一行的前面加#,注释掉

即:# allow_blob_division        F    

然后,在执行命令行:
combine_tessdata -o chi_sim.traineddata chi_sim.config

到此在使用 chi_sim.traineddata文件就不会报read_params_file: parameter not found: allow_blob_division

当然,要使用上面的命令行,需要安装Tesseract-OCR 

posted @ 2016-05-05 10:41  missAnnie  阅读(2505)  评论(2编辑  收藏  举报