会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
blog_hfg
博客园
首页
新随笔
联系
订阅
管理
RL algorithm pseudocode
DQN
DDPG(DQN是离散动作空间的,DDPG是可以用在连续动作空间)
TRPO
PPO
batch norm
posted @
2019-02-15 14:25
blog_hfg
阅读(
246
) 评论(
0
)
收藏
举报
刷新页面
返回顶部
公告