摘要: **发表时间:**2021(ICLR 2021) **文章要点:**这篇文章提出了一个分层强化学习算法HIDIO (HIerarchical RL by Discovering Intrinsic Options),用自监督的方式来学习任务无关的options,避免了人为设计,同时利用这些optio 阅读全文
posted @ 2022-12-07 08:44 initial_h 阅读(59) 评论(0) 推荐(0) 编辑