摘要: https://arxiv.org/abs/2501.11858 https://github.com/thunlp/EmbodiedEval 摘要 多模态大语言模型(MLLMs)近年来取得了显著进展,为具身智能体的发展带来了广阔前景。目前用于评估MLLMs的基准主要采用静态图像或视频,评测场景局限 阅读全文
posted @ 2025-06-27 14:24 一介布衣、 阅读(113) 评论(0) 推荐(0)