2021 年 6月 7 日随笔档案 - 灰人

2021年6月7日

摘要：因工作需要遇到了DQN和DDPG。在这里详细介绍下这两种强化学习方法。首先先说DQN。 DQN就是deep q network，谷歌设计的很多智能玩游戏的机器人基于这个算法，用表格存储每个状态的state以及这个state下每个action所拥有的q值实在太多了，需要占用太大的内存并不合理。我们可阅读全文

posted @ 2021-06-07 13:42 灰人阅读(643) 评论(0) 推荐(0)

灰人

公告