Swift 和 Tesseract OCR 进行验证码识别

一、背景介绍

Swift 是 Apple 生态中常用的编程语言,具有高性能和现代化特性。借助 Tesseract OCR,我们可以在 macOS 或 iOS 上快速进行验证码识别。
更多内容访问ttocr.com或联系1436423940
二、环境准备
2.1 安装 Tesseract OCR

在 macOS 上,可以使用 Homebrew 安装:

brew install tesseract

验证安装:

tesseract --version

2.2 创建 Swift 项目

使用 Xcode 或命令行创建一个 Swift 项目:

swift package init --type executable
cd captcha_recognizer

2.3 添加依赖

在 Package.swift 中添加 Tesseract OCR 库依赖:

// swift-tools-version:5.7
import PackageDescription

let package = Package(
name: "captcha_recognizer",
dependencies: [
.package(url: "https://github.com/gali8/TesseractOCR-iOS.git", from: "4.0.0")
],
targets: [
.executableTarget(
name: "captcha_recognizer",
dependencies: ["TesseractOCR"]
)
]
)

三、代码实现
3.1 识别验证码的核心代码

在 Sources/captcha_recognizer/main.swift 中编写以下代码:

import Foundation
import TesseractOCR

func preprocessImage(imagePath: String) -> String? {
// 使用 sips 命令进行灰度处理和二值化
let processedPath = "processed_captcha.png"
let command = "sips -g all (imagePath) --setProperty format png --setProperty formatOptions grayscale --out (processedPath)"

let result = shell(command)
if result == 0 {
    print("图像预处理完成:\(processedPath)")
    return processedPath
} else {
    print("图像预处理失败")
    return nil
}

}

func shell(_ command: String) -> Int32 {
let task = Process()
task.launchPath = "/bin/bash"
task.arguments = ["-c", command]
task.launch()
task.waitUntilExit()
return task.terminationStatus
}

func recognizeCaptcha(imagePath: String) {
if let tesseract = G8Tesseract(language: "eng") {
tesseract.engineMode = .tesseractOnly
tesseract.pageSegmentationMode = .singleLine
tesseract.image = UIImage(contentsOfFile: imagePath)
tesseract.charWhitelist = "ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789"

    if tesseract.recognize() {
        print("识别结果:\(tesseract.recognizedText ?? "识别失败")")
    } else {
        print("OCR 识别失败")
    }
} else {
    print("初始化 Tesseract 引擎失败")
}

}

let inputImage = "captcha.png"
if let processedImage = preprocessImage(imagePath: inputImage) {
recognizeCaptcha(imagePath: processedImage)
}

四、运行程序

编译和运行

swift run

输出示例

图像预处理完成:processed_captcha.png
识别结果:4GHT7

五、性能优化
5.1 设置白名单字符
tesseract.charWhitelist = "ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789"

5.2 调整 PSM 模式

选择合适的页面分割模式:

tesseract.pageSegmentationMode = .singleLine

5.3 自定义训练数据

Tesseract 允许使用自定义语言包,提高验证码识别准确率。

六、程序优势

Apple 生态兼容性:Swift 是 iOS 和 macOS 原生支持的语言。

高效性能:结合 Tesseract 实现快速验证码识别。

简洁代码:利用 Swift 和 Tesseract 的结合,使代码简洁高效。

posted @ 2025-11-14 19:14  ttocr、com  阅读(5)  评论(0)    收藏  举报