摘要:光 学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。OCR技术非常专业,一般多是印刷、打印行业 的从业人员使用,可以快速的将纸质资料转换为电子资料。关于中文OCR,目前国内水平较高的有清华文
阅读全文
随笔分类 - [OCR]
摘要:对于去除噪音的技术,没有一个统一的算法,但是一个网站的验证码噪音,一定是有一定的规则的。只有分析出这个规则,就可以写相应的代码去除干扰。 例如,通过第二步,我们已经去除了一个验证码图片的背景, 很明显能看出,这个验证码图片,被后期的的时候,加入了一条干扰线,而且干扰线出像素点事一致的,那就好办了,我
阅读全文
浙公网安备 33010602011771号