2022 年 3月 1 日随笔档案 - SilentSamsara

2022年3月1日

学习笔记-2022.03.01

摘要：学习笔记-2022.03.01 内容：阅读论文分享：HyperDQN: A Randomized Exploration for Deep RL Introduction 强化学习的一个难题是与环境交互时的样本效率好的探索策略可以减小样本复杂度。一个好的探索策略要不断尝试那些未知的/不确定的动作；阅读全文

posted @ 2022-03-01 20:24 SilentSamsara 阅读(68) 评论(0) 推荐(0)