要想彻底搞清楚这款开源OCR软件的来龙去脉,还得看Google开源项目的说明:http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3,在这里我就不过多详细的说明了。要训练一个新的语言(自定义语言或者某种自然语言都可以)对应的traineddata文件,需要产生下列过程文件:• lang.config• lang.unicharset• lang.unicharambigs• lang.inttemp• lang.pffmtable• lang.normproto• lang.punc-dawg• lang.word-dawg    Read More
posted @ 2012-06-03 22:08
血舞&葬青衣
Views(2142)
Comments(1)
Diggs(0)
        
 
                    
                
 
 浙公网安备 33010602011771号
浙公网安备 33010602011771号