验证码破解
当前很多网站登陆时需要用户输入验证码,虽然是必要的安全措施,但也随之带来了较差的用户体验。
最近项目需要,破解了一些入门级的验证码,这里将过程记录下来,作为一个学习的开头。
验证码类型:
1.彩色
2.有干扰线
3.无粘连或者少数粘连
破解工具:
1.python
2.python语言的图像处理库Pillow
破解步骤
1.锐化
2.转为灰度图
3.二值化处理
4.8邻域降噪算法降噪
5.切割
6.使用google开源的OCR库tessact来识别单个验证码,
首先安装tesseract-ocr,mac可以使用brew安装,
然后使用pip install pytesseract
注意使用中,需要将tesseract加入path,或者将pytesseract.py中的tesseract_cmd改为tesseract的绝对路径
浙公网安备 33010602011771号