会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
liubilan
缘如过江之鲫,行之匆匆
博客园
首页
新随笔
联系
订阅
管理
2020年10月19日
强化学习 Q-learning 及python实现
摘要: Q-learning是强化学习中一种经典的无监督学习方法,通过与环境交互来指导学习; 大部分强化学习都是基于马尔科夫决策(MDP)的。MDP是一个框架,而Q学习是应用了这种框架的一个具体的学习方法。 Q学习的四要素:(agent,状态 s,动作 a,奖励 r) 简而言之,agent从当前状态选择一个
阅读全文
posted @ 2020-10-19 14:20 liubilan
阅读(1703)
评论(0)
推荐(0)
公告