2019 年 2月 15 日随笔档案 - 刘建平Pinard

2019年2月15日

摘要：在前面我们讨论了基于价值的强化学习(Value Based RL)和基于策略的强化学习模型(Policy Based RL)，本篇我们讨论最后一种强化学习流派，基于模型的强化学习(Model Based RL)，以及基于模型的强化学习算法框架Dyna。本篇主要参考了UCL强化学习课程的第8讲和Dy 阅读全文

posted @ 2019-02-15 20:22 刘建平Pinard 阅读(23433) 评论(26) 推荐(2) 编辑

刘建平Pinard

十五年码农，对数学统计学，数据挖掘，机器学习，大数据平台，大数据平台应用开发，大数据可视化感兴趣。

公告