摘要: 第三章 马尔可夫决策过程 Reference: 动手学强化学习 目录第三章 马尔可夫决策过程3.1 随机过程3.1.1 基本概念3.1.2 马尔可夫过程马尔可夫性质马尔可夫过程一个简单的例子3.1.3 MDP:马尔可夫决策过程马尔可夫决策过程3.2 马尔可夫奖励过程3.2.1 回报3.2.2 价值函 阅读全文
posted @ 2025-03-08 13:34 木木ちゃん 阅读(317) 评论(0) 推荐(0)