摘要: 介绍 (1) 发表:Arxiv 09.03 (2) 背景 查明对长执行跟踪链路中错误负责的特定代理或步骤被定义为代理系统故障归因的任务。然而,当前最新的推理 LLMS 仍不为此挑战而明显不足,精度通常低于10% 尽管现有工作已经作出了初步尝试,但他们仍然存在实质性的研究差距:① 培训资源(涉及大规模 阅读全文
posted @ 2025-09-08 16:45 绵满 阅读(50) 评论(0) 推荐(0)