摘要: 1.PaddleOCR系列学习; PaddlePaddle(简称 Paddle)是一个中文友好的文档。 PP-OCRv5 是“模型 + 算法方案” Paddle 是“深度学习框架 / 运行引擎” 你的 Python 代码 │ ▼ PaddleOCR(高层封装) │ ▼ PP-OCRv5(det / 阅读全文
posted @ 2026-01-13 18:31 asphyxiasea 阅读(27) 评论(0) 推荐(0)
摘要: 1.ollama模型调用架构应对图像与pdf混合输入 现在的ollama模型调用程序本质架构: 当前有: 输入层(两种) 图片 → 多模态模型 PDF → OCR → 纯文本模型 无法应对文件类型差异,一个类型一个接口,有点臃肿 输出目标(一种) 抽取同一套 Schema(结构化 JSON) 暂时将 阅读全文
posted @ 2025-12-25 17:34 asphyxiasea 阅读(1) 评论(0) 推荐(0)
摘要: 学到了OCR 的全称是 Optical Character Recognition(光学字符识别)。 它是一种把 图片里的文字 转换成 真正的可编辑文本 的技术。 一、开发环境 / 远程连接相关 PyCharm 连接远程电脑(未完成) 如何在 PyCharm 使用 SSH 连接远程服务器做开发。 W 阅读全文
posted @ 2025-11-18 17:20 asphyxiasea 阅读(0) 评论(0) 推荐(0)