asphyxiasea - 博客园

2026年1月13日

PaddleOCR系列学习；PaddleOCR结构化输出PPStructureV3；

摘要： 1.PaddleOCR系列学习； PaddlePaddle（简称 Paddle）是一个中文友好的文档。 PP-OCRv5 是“模型 + 算法方案” Paddle 是“深度学习框架 / 运行引擎” 你的 Python 代码 │ ▼ PaddleOCR（高层封装） │ ▼ PP-OCRv5（det / 阅读全文

posted @ 2026-01-13 18:31 asphyxiasea 阅读(27) 评论(0) 推荐(0)

2025年12月25日

ollama模型调用架构应对图像与pdf混合输入；marker-pdf配置；marker-pdf的参数output_format及输出类型对比；

摘要： 1.ollama模型调用架构应对图像与pdf混合输入现在的ollama模型调用程序本质架构：当前有：输入层（两种）图片 → 多模态模型 PDF → OCR → 纯文本模型无法应对文件类型差异，一个类型一个接口，有点臃肿输出目标（一种）抽取同一套 Schema（结构化 JSON）暂时将阅读全文

posted @ 2025-12-25 17:34 asphyxiasea 阅读(1) 评论(0) 推荐(0)

2025年11月18日

开发环境 / 远程连接相关

摘要：学到了OCR 的全称是 Optical Character Recognition（光学字符识别）。它是一种把图片里的文字转换成真正的可编辑文本的技术。一、开发环境 / 远程连接相关 PyCharm 连接远程电脑（未完成）如何在 PyCharm 使用 SSH 连接远程服务器做开发。 W 阅读全文

posted @ 2025-11-18 17:20 asphyxiasea 阅读(0) 评论(0) 推荐(0)

公告