07 2011 档案

摘要:前面提到了如何使用Tesseract OCR 从复杂图像中提取文字,关键在于将图像分割,局部二值化后传给Tesseract识别,如从下图中提取每个物品的数量:方法是先使用几何特征和颜色特征将物品分割为小的局域,再将每个区域二值化。这样,每个局域就对应一个子图,传给Tesseract。但是Tesseract识别一个图像速度还行,如果识别10个,20个,速度就很慢了。识别一个如上图( 400*600)的图像需要 10秒以上!!!这显然是太慢了。其实Tesseract 识别速度和子图的数目成正比,和图像的大小倒是没什么关系,也就是识别100*100的图和识别1024*1024的图,时间差不多太多。 阅读全文
posted @ 2011-07-19 14:02 physoft 阅读(7074) 评论(3) 推荐(0)
摘要:TesseractOCR 文字识别库识别率还是非常高的,但是前提是图像背景简单,如果有复杂的背景,识别率几乎为0.下面介绍从具有复杂背景图像中应用 Tesseract OCR提取文字的关键技巧。以我做的提取运动员号码的项目为例。测试图例:更多测试图例,请访问http://www.physoft.net/?p=5541. 前处理。 前处理主要完成两个任务: a. 定位:根据目标图像的特征定位目标的区域。如图例,需要定位每个运动员数字标签的标签区域。Tesseract 对以文字为主体的图像识别率还是非常不错的。所以我们需要将定位到的区域抠出来做后面的处理,再给Tesseract 识别。定位是非常困 阅读全文
posted @ 2011-07-15 14:45 physoft 阅读(6141) 评论(0) 推荐(1)