决策大模型 - 随笔分类 - 霜尘FrostDust

RLChina2024 | 汪军 LLM and AI Agents: A Roadmap and Vision towards AGI

摘要：本文记录此次报告的key point（个人向） llm时代的几点difficulity Inference-time computation scalling OpenAI o1 利用RL来显式整合inference期间推理的step(inference-time computation) （从pr 阅读全文

posted @ 2025-03-05 11:23 霜尘FrostDust 阅读(55) 评论(1) 推荐(0)

【论文阅读】GROOT：Learning to Follow Instructions by Watching Gameplay Viedos

摘要：GROOT：Learning to Follow Instructions by Watching Gameplay Viedos.作者为北京大学梁一韬所在的Team CraftJarvis,发表时间为2023 Background 在开放世界下开发类人级别的具身智能体以解决开放式任务一直是人工智能阅读全文

posted @ 2025-01-17 11:15 霜尘FrostDust 阅读(162) 评论(0) 推荐(0)

第三届智能决策论坛|决策大模型专题报告——随笔(1)

摘要：前言这次汇报的有四位老师，其中我比较感兴趣的是上海交通大学张伟楠老师、北京大学梁一韬老师和清华大学高宸老师的报告，其中张老师之前已经记录过，本文主要作为对梁一韬老师的分享的记录与思考。 CRAFT JARVIS: Towards Generalist Agents in an Open World 阅读全文

posted @ 2025-01-10 21:01 霜尘FrostDust 阅读(268) 评论(0) 推荐(0)

FrostDust

随笔分类 - 决策大模型

公告