用 Python + PaddleOCR 玩转验证码识别

一、环境准备
安装 Python(推荐 3.8+)

安装 PaddleOCR 所需依赖:

更多内容访问ttocr.com或联系1436423940
pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
pip install paddleocr
pip install opencv-python
如果你用的是 GPU,记得用对应的 paddlepaddle-gpu 版本。

二、写点代码玩玩
新建一个 recognize_captcha.py 文件,贴上以下代码:

from paddleocr import PaddleOCR
import cv2

初始化 OCR

ocr = PaddleOCR(use_angle_cls=True, lang='en') # 支持方向分类和英文识别

读取图片

img_path = 'captcha_weird.png'
img = cv2.imread(img_path)

可以做一些预处理:灰度化、二值化等(选做)

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imwrite('gray_captcha.png', gray)

进行 OCR

result = ocr.ocr('gray_captcha.png', cls=True)

输出结果

print("识别结果:")
for line in result:
for box in line:
print(box[1][0]) # 只输出文本内容
三、准备图片
随便找个奇形怪状点的验证码,比如有如下特征:

弯曲文字

彩色背景

英文数字混合

字体比较“艺术”

把它命名成 captcha_weird.png 放项目同目录。

四、运行试试

python recognize_captcha.py
你可能会看到类似输出:

识别结果:
7V2NQ

posted @ 2025-04-12 16:03  ttocr、com  阅读(148)  评论(0)    收藏  举报