随笔档案「2025年12月16日」：Qwen-VL-8B-Instruct(多模态大语言模型 / 图生文) ... - wangssd

2025年12月16日

摘要：模型：https://www.modelscope.cn/models/Qwen/Qwen3-VL-8B-Instruct 1. 多模态理解图像理解：识别物体、场景、文字（OCR）多图推理：支持多张图像输入进行综合推理文档解析：表格、图表、公式识别细粒度理解：支持区域级别的视觉定位（通过文本阅读全文

posted @ 2025-12-16 15:17 wangssd 阅读(87) 评论(0) 推荐(0)

wangssd

公告