随笔档案「2025年12月25日」：ollama模型调用架构应对图像与pdf混合输入... - asphyxiasea

2025年12月25日

ollama模型调用架构应对图像与pdf混合输入；marker-pdf配置；marker-pdf的参数output_format及输出类型对比；

摘要： 1.ollama模型调用架构应对图像与pdf混合输入现在的ollama模型调用程序本质架构：当前有：输入层（两种）图片 → 多模态模型 PDF → OCR → 纯文本模型无法应对文件类型差异，一个类型一个接口，有点臃肿输出目标（一种）抽取同一套 Schema（结构化 JSON）暂时将阅读全文

posted @ 2025-12-25 17:34 asphyxiasea 阅读(1) 评论(0) 推荐(0)

公告