随笔分类 -  OCR

摘要:在用tesseract进行验证码识别之前,我们首先需要对验证码图片进行预处理,尽量去除噪声,而只保留有验证码信息的像素验证码噪声分析通常验证码噪声主要有以下:变色:对验证码字符像素进行变色,但一般而言为了可以辨认都是和图像底色有一定差别的。这就可以通过二值图像,把验证... 阅读全文
posted @ 2018-02-23 17:11 m*x*h 阅读(624) 评论(0) 推荐(0)
摘要:第一步: 官方安装包下载地址:download 因为只包含英文语言包,如果需要其他语言包下载地址:download the appropriate training data 并将语言包解压至tessdata目录。最常用的简体字识别包:https:/... 阅读全文
posted @ 2018-02-23 17:01 m*x*h 阅读(394) 评论(0) 推荐(0)