2025 年 4月 12 日随笔档案 - WeihangZhang

2025年4月12日

VisualPRM: An Effective Process Reward Model for Multimodal Reasoning

摘要： VisualPRM 是首个多模态过程奖励模型（PRM），通过评估“推理过程的每一步”显著提升多模态大模型（MLLMs）的推理能力，提出了专属训练集 VisualPRM400K 与评估基准 VisualProcessBench。** 背景多模态大模型在感知与识别方面已表现出色，但在复杂推理能力上仍落阅读全文

posted @ 2025-04-12 17:21 WeihangZhang 阅读(104) 评论(0) 推荐(0)

Weihang Zhang

Blogs of Weihang Zhang

公告