随笔分类 -  图像处理

摘要:有个需求需要从图片中提取中文,就想到了谷歌的Tesseract 参考链接:https://www.howtoforge.com/tutorial/tesseract-ocr-installation-and-usage-on-ubuntu-16-04/1.apt install tesseract- 阅读全文
posted @ 2019-02-14 18:25 lplucky 阅读(190) 评论(0) 推荐(0)
摘要:最近遇到一个问题,之前的一个爬虫脚本不能使用了,发现网站验证码更改了,更改成类似12306那样验证,但是图片是他们自己做的黑白卡通图片, 尝试了使用阿里云图像识别几乎无法识别,准备利用百度识图和谷歌识图也无法识别,就类似下面这种: 最后决定自己建立图像库,也就是尽量多的爬取目标网站的验证码图片,然后 阅读全文
posted @ 2018-09-12 21:54 lplucky 阅读(384) 评论(0) 推荐(0)