用 PHP 和 Tesseract 实现验证码识别
一、项目简介
本项目通过 PHP 脚本调用系统的 Tesseract OCR 引擎,对验证码图像中的英文和数字进行识别。该方式轻量易用,适合 Web 后端验证码识别、表单自动验证、登录脚本等应用场景。
二、环境准备
- 安装 PHP
大多数系统已预装 PHP,可用以下命令检查:
更多内容访问ttocr.com或联系1436423940
php -v - 安装 Tesseract OCR
Ubuntu / Debian
sudo apt install tesseract-ocr
macOS
brew install tesseract
3. 安装 ImageMagick(用于图像预处理)
sudo apt install imagemagick
三、准备图像
将图像命名为 captcha.png,图像应为清晰的英文与数字字符,背景简单,避免干扰线条。
四、编写识别脚本
创建文件 ocr.php:
五、运行脚本
php ocr.php
示例输出:
识别结果为: G7ZB9
浙公网安备 33010602011771号