随笔 - 290  文章 - 10  评论 - 85  2

1. 首先找到的是TensorFlow的 MNIST是一个入门级的计算机视觉数据集,它包含各种手写数字图片

但这个只是适合算法的比拼而已, 我需要的是任意一张手写的图片,识别出来里面的数字变成文本

 2.  找一下OCR软件排名

https://en.wikipedia.org/wiki/Comparison_of_optical_character_recognition_software

http://blog.csdn.net/wenhao_ir/article/details/52213224

https://github.com/tesseract-ocr/tesseract

下载了tesseract 3.0.2 试了试, 还是很垃圾

#强制只识别数字
tesseract.exe f:\ocr\11a.jpg 11a nobatch digits

 3. 印象中钉钉的名片识别,准确率挺高的. 我照着名片的格式,自己手写一张名片, 用钉钉识别.

中文,只要你写得工整,基本都能识别, 反而电话号码手写的识别不了. 这让我挺意外的,10个数字和几千个汉字的对比啊.

4.  百度AI开放平台,大数据的平台,识别率比开源的OCR好太多了。

http://ai.baidu.com/tech/ocr/general

 

posted on 2018-02-11 18:17  Gu  阅读(...)  评论(...编辑  收藏