摘要: 介绍 (1) 发表:FSE'25 (2) 挑战 现有工作都在探索基于 Agent 的方式来解决软件问题,但人与当前 LLM 能力之间的差异会导致基于 Agent 的方法的以下局限性: 复杂的工具使用/设计:当前基于 Agent 的方法在 Agent 和环境之间采用抽象层,将真实操作映射到 API 调 阅读全文
posted @ 2025-08-13 22:22 绵满 阅读(41) 评论(0) 推荐(0)
摘要: 介绍 (1) 发表:NIPS'24 (2) 背景 考虑直接与 Linux 终端直接互动的 Agent 的简单设置,我们发现 LM Agent 很难在这种环境下可靠地采取行动。例如,它无法提供简单的命令来编辑一个小文件段,并且如果用户进行无效编辑,则不会提供任何反馈。这些缺陷大大阻碍了性能,激发了对代 阅读全文
posted @ 2025-08-13 22:21 绵满 阅读(48) 评论(0) 推荐(0)