摘要:
1.Monte-Carlo Reinforcement Learning a)MC方法直接从经历中的episodes中学习 b)MC方法是无模型的, c)从完整的episodes中学习:而不是走一步学学一步(bootstrapping) d)注意:只能将MC方法应用到episodic MDPs,而且 阅读全文
posted @ 2017-04-14 21:37
陈煜弘
阅读(290)
评论(0)
推荐(0)
摘要:
1.生成dot 2.根据生成的dot生成png图 3.结果: 4.使用代码 阅读全文
posted @ 2017-04-14 12:18
陈煜弘
阅读(237)
评论(0)
推荐(0)

浙公网安备 33010602011771号