摘要: **发表时间:**2020(ICLR2020) **文章要点:**这篇文章提出了一个无监督的model-based的学习算法Dynamics-Aware Discovery of Skills (DADS),可以同时发现可预测的行为以及学习他们的dynamics。然后对于新任务,可以直接用zero- 阅读全文
posted @ 2023-05-09 22:42 initial_h 阅读(24) 评论(0) 推荐(0) 编辑