2017 年 4月 14 日随笔档案 - 陈煜弘

2017年4月14日

摘要： 1.Monte-Carlo Reinforcement Learning a)MC方法直接从经历中的episodes中学习 b)MC方法是无模型的， c)从完整的episodes中学习：而不是走一步学学一步（bootstrapping） d)注意：只能将MC方法应用到episodic MDPs，而且阅读全文

posted @ 2017-04-14 21:37 陈煜弘阅读(294) 评论(0) 推荐(0)

Software Testing -- LAB03-soot的使用

摘要： 1.生成dot 2.根据生成的dot生成png图 3.结果： 4.使用代码阅读全文

posted @ 2017-04-14 12:18 陈煜弘阅读(238) 评论(0) 推荐(0)

博客园

陈煜弘

公告