使用 PHP 和 Tesseract 实现验证码识别工具
一、项目简介
本项目用 PHP 脚本结合系统安装的 Tesseract OCR 引擎,从验证码图像中识别出包含英文和数字的字符。无需额外服务,只依赖 PHP 与系统命令行。
更多内容访问ttocr.com或联系1436423940
适合以下用途:
后台自动化处理图像验证码
Web 应用自动登录支持
Web 后台接口集成 OCR
二、环境准备
- 安装 PHP
大多数系统已自带 PHP,也可通过如下方式安装:
sudo apt install php # Ubuntu
brew install php # macOS
2. 安装 Tesseract OCR
sudo apt install tesseract-ocr
brew install tesseract
确保 tesseract 命令可以在终端运行:
tesseract --version
三、准备验证码图像
将验证码图像命名为 captcha.png,放在脚本目录下。图像内容为清晰的英文字母和数字组合。
四、PHP 识别代码
创建文件 ocr.php:
五、运行脚本
在命令行执行:
php ocr.php
输出示例:
识别结果为:A9ZT2
浙公网安备 33010602011771号