摘要:
强化学习读书笔记 00 术语和数学符号 学习笔记: "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 基本概念 Agent 本体。学习者、决策者。 E 阅读全文
posted @ 2017-03-25 14:46
SNYang
阅读(14231)
评论(4)
推荐(8)
摘要:
强化学习读书笔记 12 资格痕迹(Eligibility Traces) 学习笔记: "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 参照 "Rei 阅读全文
posted @ 2017-03-25 14:42
SNYang
阅读(10196)
评论(2)
推荐(2)

浙公网安备 33010602011771号