随笔分类 -  文字识别

摘要:在今年泰迪杯A题电商中图片的文字识别这道题中,我们先用了一种很笨的办法来分割字符。 首先对图片进行灰度化,然后二值化,这里的二值化要选择一个合适的阈值。然后我们进行轮廓的提取,计算轮廓最小矩形的面积,若面积过大,则认为这个是背景图片,若面积过小,则认为是噪点。这种方法有一个弊端,就是文字有大有小,大 阅读全文
posted @ 2016-05-21 22:09 狼.wrz 阅读(965) 评论(1) 推荐(0)
摘要:本文由@ray 出品,转载请注明出处。 文章链接: http://www.cnblogs.com/wolfray/p/5547267.html 在泰迪杯A题中,我刚刚接触了Tesseact,其中训练字库中遇到了较多的问题。所以在此记录一下,也当做一个笔记,省得以后忘记。 为了方便 ,将tif命名格式 阅读全文
posted @ 2016-05-02 16:34 狼.wrz 阅读(3326) 评论(0) 推荐(0)