摘要: 视频理解模型推理与微调 随着多模态大模型的持续发展,视频理解、多模态检索和智能标注等应用场景逐渐落地。为了进一步探究多模态视频理解模型在实际工程中的应用方式,本文以 Qwen3-VL 系列模型为例,系统梳理其在视频场景下的推理与全参数微调实践。文章首先通过一个完整的视频本地推理示例,详细拆解模型输入 阅读全文
posted @ 2026-01-14 20:54 ZacksTang 阅读(285) 评论(0) 推荐(0)