用 Swift 结合 Tesseract OCR 解析验证码

  1. 环境准备
    1.1 安装 Swift

如果使用 macOS,可以直接在 Xcode 中使用 Swift。检查 Swift 是否安装:

swift --version

如果使用 Linux,可参考 Swift 官方网站
进行安装。
更多内容访问ttocr.com或联系1436423940
1.2 安装 Tesseract OCR
macOS(Homebrew)
brew install tesseract

Linux(Ubuntu)
sudo apt install tesseract-ocr

Windows

可以从 Tesseract GitHub
下载并安装。

安装完成后,检查是否成功安装:

tesseract --version

1.3 创建 Swift 项目

在 macOS 上,可以使用 Xcode 或者 Swift Package Manager (SPM):

mkdir captcha_reader
cd captcha_reader
swift package init --type executable

然后在 Package.swift 添加 SwiftyTesseract 依赖:

// swift-tools-version:5.5
import PackageDescription

let package = Package(
name: "CaptchaReader",
dependencies: [
.package(url: "https://github.com/SwiftyTesseract/SwiftyTesseract.git", from: "2.0.0")
],
targets: [
.target(
name: "CaptchaReader",
dependencies: ["SwiftyTesseract"]
)
]
)

  1. 代码实现

在 Sources/CaptchaReader/main.swift 文件中写入以下代码:

import Foundation
import SwiftyTesseract

let imagePath = "captcha.png" // 替换为你的验证码图片路径

// 初始化 OCR 识别器
let ocr = SwiftyTesseract(language: .english)

if let image = NSImage(contentsOfFile: imagePath) {
ocr.performOCR(on: image) { result in
switch result {
case .success(let text):
print("识别出的验证码: (text.trimmingCharacters(in: .whitespacesAndNewlines))")
case .failure(let error):
print("OCR 识别失败: (error)")
}
}
} else {
print("无法加载图像")
}

  1. 代码解析
    3.1 读取图像
    if let image = NSImage(contentsOfFile: imagePath) {

读取 captcha.png 作为 NSImage。

3.2 进行 OCR 识别
ocr.performOCR(on: image) { result in

调用 SwiftyTesseract 进行验证码解析。

3.3 处理识别结果
case .success(let text):
print("识别出的验证码: (text.trimmingCharacters(in: .whitespacesAndNewlines))")

获取 OCR 结果并去除多余的空格。

  1. 运行程序

确保 captcha.png 存在于项目目录下,然后执行:

swift run

示例输出:

识别出的验证码: X7G9H

  1. 提高 OCR 识别率
    5.1 选择不同的 Tesseract PSM 模式
    ocr.tesseractOptions = ["tessedit_pageseg_mode": "6"]

PSM 6 适用于单行验证码,提高准确率。

5.2 限制识别字符集
ocr.tesseractOptions = ["tessedit_char_whitelist": "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ"]

让 Tesseract 只识别数字和大写字母,提高精确度。

posted @ 2025-09-01 22:22  ttocr、com  阅读(8)  评论(0)    收藏  举报