会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
线性流逝
博客园
首页
新随笔
联系
订阅
管理
随笔分类 -
强化学习
马尔科夫决策过程
摘要:#基本定义 ##时序决策 在人工智能领域,时序决策是考虑了世界是动态变化的算法,可以认为是一种循序渐进的决策理论,较早的决策会影响较晚的可用选择。例如我们考虑一个推箱子到指定区域的问题,从初始状态(start state)到目标状态(goal state)的一系列动作(action)都会影响到达目标
阅读全文
posted @
2020-08-08 22:09
线性流逝
阅读(578)
评论(0)
推荐(0)
公告