会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
北极星!
最迷人的地方不是远方,而是在这里却没有欣赏到此刻的美丽—北极星!
首页
新随笔
管理
2021年10月27日
马尔可夫、马尔可夫链、马尔可夫过程、马尔可夫决策过程
摘要: 1. 马尔科夫性 无后效性,下一个状态只和当前状态有关而与之前的状态无关,公式描述:P[St+1|St]=P[St+1|S1,...,St]。强化学习中的状态也服从马尔科夫性,因此才能在当前状态下执行动作并转移到下一个状态,而不需要考虑之前的状态。 2. 马尔科夫过程 马尔科夫过程是随机过程的一种,
阅读全文
posted @ 2021-10-27 20:25 北极星!
阅读(567)
评论(0)
推荐(0)
公告