随笔分类 - 决策大模型
摘要:本文记录此次报告的key point(个人向) llm时代的几点difficulity Inference-time computation scalling OpenAI o1 利用RL来显式整合inference期间推理的step(inference-time computation) (从pr
阅读全文
摘要:GROOT:Learning to Follow Instructions by Watching Gameplay Viedos.作者为北京大学梁一韬所在的Team CraftJarvis,发表时间为2023 Background 在开放世界下开发类人级别的具身智能体以解决开放式任务一直是人工智能
阅读全文
摘要:前言 这次汇报的有四位老师,其中我比较感兴趣的是上海交通大学张伟楠老师、北京大学梁一韬老师和清华大学高宸老师的报告,其中张老师之前已经记录过,本文主要作为对梁一韬老师的分享的记录与思考。 CRAFT JARVIS: Towards Generalist Agents in an Open World
阅读全文

浙公网安备 33010602011771号