摘要: 1.ollama模型调用架构应对图像与pdf混合输入 现在的ollama模型调用程序本质架构: 当前有: 输入层(两种) 图片 → 多模态模型 PDF → OCR → 纯文本模型 无法应对文件类型差异,一个类型一个接口,有点臃肿 输出目标(一种) 抽取同一套 Schema(结构化 JSON) 暂时将 阅读全文
posted @ 2025-12-25 17:34 asphyxiasea 阅读(1) 评论(0) 推荐(0)