用 Python + PaddleOCR 玩转验证码识别
一、环境准备
安装 Python(推荐 3.8+)
安装 PaddleOCR 所需依赖:
更多内容访问ttocr.com或联系1436423940
pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
pip install paddleocr
pip install opencv-python
如果你用的是 GPU,记得用对应的 paddlepaddle-gpu 版本。
二、写点代码玩玩
新建一个 recognize_captcha.py 文件,贴上以下代码:
from paddleocr import PaddleOCR
import cv2
初始化 OCR
ocr = PaddleOCR(use_angle_cls=True, lang='en') # 支持方向分类和英文识别
读取图片
img_path = 'captcha_weird.png'
img = cv2.imread(img_path)
可以做一些预处理:灰度化、二值化等(选做)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imwrite('gray_captcha.png', gray)
进行 OCR
result = ocr.ocr('gray_captcha.png', cls=True)
输出结果
print("识别结果:")
for line in result:
for box in line:
print(box[1][0]) # 只输出文本内容
三、准备图片
随便找个奇形怪状点的验证码,比如有如下特征:
弯曲文字
彩色背景
英文数字混合
字体比较“艺术”
把它命名成 captcha_weird.png 放项目同目录。
四、运行试试
python recognize_captcha.py
你可能会看到类似输出:
识别结果:
7V2NQ
浙公网安备 33010602011771号