使用 Go 语言实现英文数字验证码识别(基于 Tesseract)

一、环境准备

  1. 安装 Go
    访问官方地址 https://golang.org/dl/ 下载并安装 Go。

  2. 安装 Tesseract OCR
    你需要在系统中安装 Tesseract:

macOS: brew install tesseract

Ubuntu: sudo apt install tesseract-ocr
更多内容访问ttocr.com或联系1436423940
Windows: 下载地址:https://github.com/tesseract-ocr/tesseract

二、安装 Go OCR 包
打开终端,初始化你的 Go 项目:

mkdir go-captcha-ocr && cd go-captcha-ocr
go mod init go-captcha-ocr
安装执行命令的库(我们将调用系统 Tesseract 命令):

go get github.com/otiai10/gosseract/v2
三、编写 OCR 程序
创建 main.go 文件,并写入以下内容:

package main

import (
"fmt"
"log"

"github.com/otiai10/gosseract/v2"

)

func main() {
client := gosseract.NewClient()
defer client.Close()

err := client.SetImage("captcha.png")
if err != nil {
    log.Fatal(err)
}

// 可选:限制识别字符
client.SetWhitelist("ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789")

text, err := client.Text()
if err != nil {
    log.Fatal(err)
}

fmt.Println("识别结果:", text)

}
四、准备验证码图片
将你的验证码图像命名为 captcha.png 并放在当前项目目录下。

五、运行程序
在终端中执行:

go run main.go
你将看到类似输出:

识别结果: G7Q2Z

posted @ 2025-05-11 12:31  ttocr、com  阅读(29)  评论(0)    收藏  举报