06 2025 档案

摘要:基本流程 核心思想 目标:让小规模开源模型(如32B参数)在单GPU上达到与大型闭源模型(如671B参数)相近的性能。 关键策略: 内部测试时计算(Internal TTC):训练模型进行更长的多步推理。 外部测试时计算(External TTC):在推理时生成多个候选方案,并通过验证筛选最优解。 阅读全文
posted @ 2025-06-03 18:09 AikNr 阅读(83) 评论(0) 推荐(0)