摘要: 2025-04-01,由IBM创建的ACPBench Hard数据集,通过开放性生成任务,将规划过程中的推理能力挑战推向极致,为评估和提升模型在行动、变化和规划方面的推理能力提供了全新视角,也为未来规划领域模型的发展指明了方向。 一、研究背景 推理和规划是人工智能的基石。随着大型语言模型的出现,研究 阅读全文
posted @ 2025-04-03 11:32 数据猎手小k 阅读(61) 评论(0) 推荐(0)