会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
AikNr
噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜
博客园
首页
新随笔
联系
订阅
管理
06 2025 档案
Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute
摘要:基本流程 核心思想 目标:让小规模开源模型(如32B参数)在单GPU上达到与大型闭源模型(如671B参数)相近的性能。 关键策略: 内部测试时计算(Internal TTC):训练模型进行更长的多步推理。 外部测试时计算(External TTC):在推理时生成多个候选方案,并通过验证筛选最优解。
阅读全文
posted @
2025-06-03 18:09
AikNr
阅读(83)
评论(0)
推荐(0)
公告