摘要:
强化学习笔记专栏传送 上一篇:强化学习RL学习笔记4-马尔可夫决策过程(MDP)(1) 下一篇:强化学习RL学习笔记6-马尔可夫决策... 阅读全文
posted @ 2020-12-04 23:08
liaojq2020
阅读(169)
评论(0)
推荐(0)
摘要:
目录 一、基本概念1.多阶段决策问题2.适用条件(1)最优化原理(最优子结构性质)(2)无后效性 二、算法步骤三、算法... 阅读全文
posted @ 2020-12-04 08:54
liaojq2020
阅读(109)
评论(0)
推荐(0)

浙公网安备 33010602011771号