摘要: **发表时间:**2021(NeurIPS 2021) **文章要点:**这篇文章提出Latent Explorer Achiever (LEXA)算法,通过学习world model的imagined rollouts来训练一个explorer策略和一个achiever策略,通过unsupervi 阅读全文
posted @ 2022-05-04 22:23 initial_h 阅读(122) 评论(0) 推荐(0) 编辑