会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
灰人
博客园
首页
新随笔
联系
管理
订阅
2021年6月7日
DQN和DDPG
摘要: 因工作需要遇到了DQN和DDPG。在这里详细介绍下这两种强化学习方法。 首先先说DQN。 DQN就是deep q network,谷歌设计的很多智能玩游戏的机器人基于这个算法,用表格存储每个状态的state以及这个state下每个action所拥有的q值实在太多了,需要占用太大的内存并不合理。我们可
阅读全文
posted @ 2021-06-07 13:42 灰人
阅读(643)
评论(0)
推荐(0)
公告