验证码破解

当前很多网站登陆时需要用户输入验证码,虽然是必要的安全措施,但也随之带来了较差的用户体验。

最近项目需要,破解了一些入门级的验证码,这里将过程记录下来,作为一个学习的开头。

 

验证码类型:

  1.彩色

  2.有干扰线

  3.无粘连或者少数粘连

 

破解工具:

  1.python

  2.python语言的图像处理库Pillow 

  

破解步骤

1.锐化

2.转为灰度图

3.二值化处理

4.8邻域降噪算法降噪

5.切割

6.使用google开源的OCR库tessact来识别单个验证码,

  首先安装tesseract-ocr,mac可以使用brew安装,

  然后使用pip install pytesseract

  注意使用中,需要将tesseract加入path,或者将pytesseract.py中的tesseract_cmd改为tesseract的绝对路径

 

posted @ 2016-12-10 01:18  swaggyC  阅读(335)  评论(0)    收藏  举报