会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
于风‘s blog
「博学之,审问之,慎思之,明辨之,笃行之」
联系
管理
2020年5月27日
DQN(Deep Q-learning)入门教程(二)之最优选择
摘要: 在上一篇博客:DQN(Deep Q-learning)入门教程(一)之强化学习介绍中有三个很重要的函数: 策略:\(\pi(a|s) = P(A_t=a | S_t=s)\) 状态价值函数:\(v_\pi(s)=\mathbb{E}\left[R_{t+1}+\gamma \left(S_{t+1}
阅读全文
posted @ 2020-05-27 15:21 渣渣辉啊
阅读(5838)
评论(2)
推荐(2)
公告