用 PHP 和 Tesseract 实现验证码识别

一、项目简介
本项目通过 PHP 脚本调用系统的 Tesseract OCR 引擎,对验证码图像中的英文和数字进行识别。该方式轻量易用,适合 Web 后端验证码识别、表单自动验证、登录脚本等应用场景。

二、环境准备

  1. 安装 PHP
    大多数系统已预装 PHP,可用以下命令检查:
    更多内容访问ttocr.com或联系1436423940
    php -v
  2. 安装 Tesseract OCR

Ubuntu / Debian

sudo apt install tesseract-ocr

macOS

brew install tesseract
3. 安装 ImageMagick(用于图像预处理)

sudo apt install imagemagick
三、准备图像
将图像命名为 captcha.png,图像应为清晰的英文与数字字符,背景简单,避免干扰线条。

四、编写识别脚本
创建文件 ocr.php:

五、运行脚本

php ocr.php
示例输出:

识别结果为: G7ZB9

posted @ 2025-07-08 23:28  ttocr、com  阅读(34)  评论(0)    收藏  举报