摘要:
https://arxiv.org/abs/2507.21504 摘要 基于大型语言模型(LLM)的代理(Agent)的兴起为人工智能(AI)应用开辟了新的前沿,但对这些代理的评估仍然是一个复杂且尚不成熟的领域。本综述深入概述了 LLM 代理评估这一新兴领域,并引入了一个二维分类法,该分类法从以下两 阅读全文
posted @ 2025-10-28 15:34
一介布衣、
阅读(158)
评论(0)
推荐(0)
摘要:
https://arxiv.org/abs/2510.17801 摘要 构建能够在动态、非结构化环境中感知、推理和行动的机器人仍然是一个核心挑战。近期的具身系统通常采用双系统范式,其中系统2(System 2)处理高层推理,而系统1(System 1)执行底层控制。在这项工作中,我们将系统2称为 “ 阅读全文
posted @ 2025-10-28 10:45
一介布衣、
阅读(112)
评论(0)
推荐(0)

浙公网安备 33010602011771号