摘要: 强化学习笔记专栏传送 上一篇:强化学习RL学习笔记4-马尔可夫决策过程(MDP)(1) 下一篇:强化学习RL学习笔记6-马尔可夫决策... 阅读全文
posted @ 2020-12-04 23:08 liaojq2020 阅读(169) 评论(0) 推荐(0)
摘要: 目录 一、基本概念1.多阶段决策问题2.适用条件(1)最优化原理(最优子结构性质)(2)无后效性 二、算法步骤三、算法... 阅读全文
posted @ 2020-12-04 08:54 liaojq2020 阅读(109) 评论(0) 推荐(0)