用 Python 和 EasyOCR 实现英文数字验证码识别
一 项目简介
EasyOCR 是一个轻量但强大的 OCR 库 支持多语言 也支持英文和数字验证码识别 本项目使用它来读取图像中的验证码内容 通过简单的 Python 脚本完成图像预处理和文字提取
适合用途包括
登录界面的验证码自动识别
更多内容访问ttocr.com或联系1436423940
表单自动填充
简单图像识别脚本
二 安装环境
首先安装 Python 建议使用 Python 三点八或更高版本 然后安装 EasyOCR 和图像处理库 OpenCV
pip install easyocr opencv-python
三 准备验证码图像
将验证码图像保存为 captcha.png 建议内容为纯英文或英文加数字 图像清晰且背景干净
四 编写识别代码
创建一个文件名为 captcha_easyocr.py 的文件 输入以下内容
import cv2
import easyocr
import re
加载图像并进行预处理
img = cv2.imread('captcha.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
_, thresh = cv2.threshold(gray, 120, 255, cv2.THRESH_BINARY)
保存处理后的图像
cv2.imwrite('processed.png', thresh)
初始化 OCR 识别器
reader = easyocr.Reader(['en'])
进行文字识别
results = reader.readtext('processed.png', detail=0)
合并所有结果并过滤出英文数字
raw_text = ''.join(results)
cleaned = re.sub(r'[^A-Za-z0-9]', '', raw_text)
print('识别结果为', cleaned)
五 运行程序
确保 captcha.png 文件存在 然后运行
python captcha_easyocr.py
输出示例
识别结果为 X9KZ3
浙公网安备 33010602011771号