gxh973121

博客园 首页 新随笔 联系 订阅 管理

2013年12月16日 #

摘要: 本文是对tesseract-ocr 使用的进一步技术升级说明,使用默认的识别库识别率比较低怎么办?不用着急,tesseract-ocr本身的工具中提供了使用你提供的素材进行人工修正以提高识别率的方法。下面我们就来看一下。参考:http://my.oschina.net/lixinspace/blog/601241 下载并安装3.02版本的tesseract2 如果你的训练素材是很多张非tiff格式的图片,首先要做的事情就是将这么图片合并(个人觉得素材越多,基本每个字母和数字都覆盖了训练出来的识别率比较好)http://sourceforge.net/projects/vietocr/files 阅读全文
posted @ 2013-12-16 10:00 gxh973121 阅读(2206) 评论(0) 推荐(0) 编辑