摘要: 1.domain包与util包; domain包的正确职责: 👉你的系统“关心的事物本身” 👉不是工具,不是 HTTP,不是数据库 👉而是:你的系统“理解世界的方式” 👉有用的实体类。 util 的正确职责(非常窄): 工具就仅仅是工具,很少参与到系统当中,比如pdf转换base64 特征 阅读全文
posted @ 2026-01-23 11:53 asphyxiasea 阅读(1) 评论(0) 推荐(0)
摘要: 1.PPStructureV3包含了很多模型包括PP-OCRv5 PDF / 图片 → 页面结构 → 区域语义 → OCR / 表格 / 印章 → 可用文本或结构化结果 👉 PP-Structure ≠ OCR 👉 它是一个多模型调度系统 PP-Structure V3 的整体流水线(非常重要) 阅读全文
posted @ 2026-01-23 11:52 asphyxiasea 阅读(3) 评论(0) 推荐(0)
摘要: 1.本地化部署模型供后端调用的平台整体架构梳理; “模型服务平台”,根路径建议用一个“平台级、模型无关”的名字,而不是具体模型名。 2.schema自动装配; 👉schema自动装配包含创建实例; 👉所以需要缓存,对相同的提示词进行缓存schema防止以后运行久了,创建无数的schema 👉s 阅读全文
posted @ 2026-01-23 11:52 asphyxiasea 阅读(1) 评论(0) 推荐(0)
摘要: 1.paddlepaddle中各个框架分工; (1)PP-OCRv5产线级(“认字机器”) PP-OCRv5 不关心“这行字是标题还是正文”。 (2)PPStructureV3产线级 PPStructureV3包含了PP-OCRv5,并且有文件版面识别。 能力 PP-OCRv5 PPStructur 阅读全文
posted @ 2026-01-23 11:52 asphyxiasea 阅读(2) 评论(0) 推荐(0)
摘要: 1.git官方库PaddleOCR提供的几种模型库; PaddleOCR-VL - 通过 0.9B VLM 进行多语言文档解析。 该模型是专为文档解析量身定制的 SOTA 和资源高效模型,支持 109 种语言,擅长识别复杂元素(例如文本、表格、公式和图表),同时保持最小的资源消耗。 PP-OCRv5 阅读全文
posted @ 2026-01-23 11:52 asphyxiasea 阅读(5) 评论(0) 推荐(0)
摘要: 1.paddleOCR识别模型训练流程 参考文章如下: 制作rec数据集 rec是用来训练文字识别的数据集。 制作rec数据集时,需要将数据集合分为训练集和测试集: 我使用的是官方的训练集和测试集分法gen_ocr_train_val_test.py 这个文件是在PPOCRLabel本地文件处: 我 阅读全文
posted @ 2026-01-23 11:51 asphyxiasea 阅读(3) 评论(0) 推荐(0)
摘要: 1.docker服务化部署paddleocr-vl; 它由 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型组成,能够实现精准的元素识别。 paddleocr-vl是一个VLM模型,能够直接输入图像文件或者PDF文件。 由于是显卡是5090,使用sm120架构的doc 阅读全文
posted @ 2026-01-23 11:50 asphyxiasea 阅读(2) 评论(0) 推荐(0)
摘要: 1.文档识别架构思路整理 “直接把整个文件给 LLM”本来就不对 👉 Paddle 负责“看清楚”,LLM 负责“想明白” 1️⃣ LLM 的天然限制 上下文窗口有限(即便 128k 也不够 PDF / 扫描件) 成本高 注意力会被无关内容稀释 2️⃣ Paddle 更适合干的事 、LLM 更适合 阅读全文
posted @ 2026-01-23 11:49 asphyxiasea 阅读(3) 评论(0) 推荐(0)
摘要: dify配置接口; 可以上传多个文件的配置方法如下: "files": { "type": "array", "items":{ "type": "string", "format": "binary" } } 配置单个文件的接口字段配置如下: "file": {"type": "string"," 阅读全文
posted @ 2026-01-23 11:44 asphyxiasea 阅读(5) 评论(0) 推荐(0)
摘要: 1.PaddleOCR系列学习; PaddlePaddle(简称 Paddle)是一个中文友好的文档。 PP-OCRv5 是“模型 + 算法方案” Paddle 是“深度学习框架 / 运行引擎” 你的 Python 代码 │ ▼ PaddleOCR(高层封装) │ ▼ PP-OCRv5(det / 阅读全文
posted @ 2026-01-13 18:31 asphyxiasea 阅读(0) 评论(0) 推荐(0)