摘要:        
Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以识别多种格式的图像文件并将其转换成文本,目前已支持60多种语言(包括中文)。Tesseract最初由HP公司开发,后来由Google维护,目前发布在Googel Project上。地址为http://code.google.com/p/tesseract-ocr/。使用默认的语言库识别1.安装Tesseract 从http://code.google.com/p/tesseract-ocr/downloads/list下载Tesseract,目前版本为Tessera...    阅读全文
        
            posted @ 2013-06-27 17:42
Sam Lin
阅读(50390)
评论(3)
推荐(1)
        
        
                    
                
浙公网安备 33010602011771号