使用 Go 语言实现英文数字验证码识别(基于 Tesseract)
一、环境准备
-
安装 Go
访问官方地址 https://golang.org/dl/ 下载并安装 Go。 -
安装 Tesseract OCR
你需要在系统中安装 Tesseract:
macOS: brew install tesseract
Ubuntu: sudo apt install tesseract-ocr
更多内容访问ttocr.com或联系1436423940
Windows: 下载地址:https://github.com/tesseract-ocr/tesseract
二、安装 Go OCR 包
打开终端,初始化你的 Go 项目:
mkdir go-captcha-ocr && cd go-captcha-ocr
go mod init go-captcha-ocr
安装执行命令的库(我们将调用系统 Tesseract 命令):
go get github.com/otiai10/gosseract/v2
三、编写 OCR 程序
创建 main.go 文件,并写入以下内容:
package main
import (
"fmt"
"log"
"github.com/otiai10/gosseract/v2"
)
func main() {
client := gosseract.NewClient()
defer client.Close()
err := client.SetImage("captcha.png")
if err != nil {
log.Fatal(err)
}
// 可选:限制识别字符
client.SetWhitelist("ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789")
text, err := client.Text()
if err != nil {
log.Fatal(err)
}
fmt.Println("识别结果:", text)
}
四、准备验证码图片
将你的验证码图像命名为 captcha.png 并放在当前项目目录下。
五、运行程序
在终端中执行:
go run main.go
你将看到类似输出:
识别结果: G7Q2Z
浙公网安备 33010602011771号