摘要: 核心性质: 马尔可夫性: 一个随机过程在给定现在状态和所有历史状态的情况下,其未来状态的条件概率分布仅依赖于当前状态。即未来的转移和过去是独立的,只取决于现在。 马尔可夫决策过程 是顺序决策问题的数学模型,用于在随机性和不确定性的环境中模拟智能体的决策过程。 简单来说,它描述了一个场景:一个“智能体 阅读全文
posted @ 2025-10-20 15:47 wangssd 阅读(32) 评论(0) 推荐(0)