摘要: https://arxiv.org/abs/2507.21504 摘要 基于大型语言模型(LLM)的代理(Agent)的兴起为人工智能(AI)应用开辟了新的前沿,但对这些代理的评估仍然是一个复杂且尚不成熟的领域。本综述深入概述了 LLM 代理评估这一新兴领域,并引入了一个二维分类法,该分类法从以下两 阅读全文
posted @ 2025-10-28 15:34 一介布衣、 阅读(158) 评论(0) 推荐(0)
摘要: https://arxiv.org/abs/2510.17801 摘要 构建能够在动态、非结构化环境中感知、推理和行动的机器人仍然是一个核心挑战。近期的具身系统通常采用双系统范式,其中系统2(System 2)处理高层推理,而系统1(System 1)执行底层控制。在这项工作中,我们将系统2称为 “ 阅读全文
posted @ 2025-10-28 10:45 一介布衣、 阅读(112) 评论(0) 推荐(0)