会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
The Blog of Xiao Wang
Associate Professor, School of Computer Science and Technology, Anhui University, Email: xiaowang@ahu.edu.cn
博客园
首页
新随笔
联系
订阅
管理
2016年6月10日
(译) 强化学习 第一部分:Q-Learning 以及相关探索
摘要: (译) 强化学习 第一部分:Q-Learning 以及相关探索 Q-Learning review: Q-Learning 的基础要点是:有一个关于环境状态S的表达式,这些状态中可能的动作 a,然后你学习这些状态下他们action的值。直观的讲,这个值,Q,是 状态-动作值(state-action
阅读全文
posted @ 2016-06-10 16:45 AHU-WangXiao
阅读(701)
评论(0)
推荐(0)
公告