摘要:
1.ollama模型调用架构应对图像与pdf混合输入 现在的ollama模型调用程序本质架构: 当前有: 输入层(两种) 图片 → 多模态模型 PDF → OCR → 纯文本模型 无法应对文件类型差异,一个类型一个接口,有点臃肿 输出目标(一种) 抽取同一套 Schema(结构化 JSON) 暂时将 阅读全文
posted @ 2025-12-25 17:34
asphyxiasea
阅读(1)
评论(0)
推荐(0)
浙公网安备 33010602011771号