摘要: https://arxiv.org/abs/2502.21257 摘要 近年来,多模态大语言模型(MLLMs)在多模态场景中展现出了卓越的能力。然而,它们在机器人场景中的应用,尤其是长时序操作任务,仍存在显著局限。这些局限主要源于当前MLLMs缺乏三项机器人“大脑”核心能力:规划能力(将复杂操作指令 阅读全文
posted @ 2025-06-16 15:30 一介布衣、 阅读(218) 评论(0) 推荐(0)