会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
wangssd
博客园
首页
新随笔
联系
订阅
管理
2025年10月20日
马尔可夫决策过程/贝尔曼方程 理解
摘要: 核心性质: 马尔可夫性: 一个随机过程在给定现在状态和所有历史状态的情况下,其未来状态的条件概率分布仅依赖于当前状态。即未来的转移和过去是独立的,只取决于现在。 马尔可夫决策过程 是顺序决策问题的数学模型,用于在随机性和不确定性的环境中模拟智能体的决策过程。 简单来说,它描述了一个场景:一个“智能体
阅读全文
posted @ 2025-10-20 15:47 wangssd
阅读(32)
评论(0)
推荐(0)
公告