用 Swift 结合 Tesseract OCR 解析验证码
- 环境准备
1.1 安装 Swift
如果使用 macOS,可以直接在 Xcode 中使用 Swift。检查 Swift 是否安装:
swift --version
如果使用 Linux,可参考 Swift 官方网站
进行安装。
更多内容访问ttocr.com或联系1436423940
1.2 安装 Tesseract OCR
macOS(Homebrew)
brew install tesseract
Linux(Ubuntu)
sudo apt install tesseract-ocr
Windows
可以从 Tesseract GitHub
下载并安装。
安装完成后,检查是否成功安装:
tesseract --version
1.3 创建 Swift 项目
在 macOS 上,可以使用 Xcode 或者 Swift Package Manager (SPM):
mkdir captcha_reader
cd captcha_reader
swift package init --type executable
然后在 Package.swift 添加 SwiftyTesseract 依赖:
// swift-tools-version:5.5
import PackageDescription
let package = Package(
name: "CaptchaReader",
dependencies: [
.package(url: "https://github.com/SwiftyTesseract/SwiftyTesseract.git", from: "2.0.0")
],
targets: [
.target(
name: "CaptchaReader",
dependencies: ["SwiftyTesseract"]
)
]
)
- 代码实现
在 Sources/CaptchaReader/main.swift 文件中写入以下代码:
import Foundation
import SwiftyTesseract
let imagePath = "captcha.png" // 替换为你的验证码图片路径
// 初始化 OCR 识别器
let ocr = SwiftyTesseract(language: .english)
if let image = NSImage(contentsOfFile: imagePath) {
ocr.performOCR(on: image) { result in
switch result {
case .success(let text):
print("识别出的验证码: (text.trimmingCharacters(in: .whitespacesAndNewlines))")
case .failure(let error):
print("OCR 识别失败: (error)")
}
}
} else {
print("无法加载图像")
}
- 代码解析
3.1 读取图像
if let image = NSImage(contentsOfFile: imagePath) {
读取 captcha.png 作为 NSImage。
3.2 进行 OCR 识别
ocr.performOCR(on: image) { result in
调用 SwiftyTesseract 进行验证码解析。
3.3 处理识别结果
case .success(let text):
print("识别出的验证码: (text.trimmingCharacters(in: .whitespacesAndNewlines))")
获取 OCR 结果并去除多余的空格。
- 运行程序
确保 captcha.png 存在于项目目录下,然后执行:
swift run
示例输出:
识别出的验证码: X7G9H
- 提高 OCR 识别率
5.1 选择不同的 Tesseract PSM 模式
ocr.tesseractOptions = ["tessedit_pageseg_mode": "6"]
PSM 6 适用于单行验证码,提高准确率。
5.2 限制识别字符集
ocr.tesseractOptions = ["tessedit_char_whitelist": "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ"]
让 Tesseract 只识别数字和大写字母,提高精确度。
浙公网安备 33010602011771号