2019 年 7月 15 日随笔档案 - qiynet

2019年7月15日

摘要：原文：https://zhuanlan.zhihu.com/p/65116688 经典强化学习：在标准强化学习任务中，智能体与环境之间的交互作用常常建模为马尔科夫决策过程，本专栏的第一讲就是马尔科夫决策过程，不熟悉的读者可以到第一讲去看看。为了保证行文连贯性，这里再简单重复下马尔科夫决策过程。马阅读全文

posted @ 2019-07-15 19:36 qiynet 阅读(431) 评论(0) 推荐(0)

2018年强化学习领域十篇重要论文（附源码）[转]

摘要：原文：https://zhuanlan.zhihu.com/p/68205048 与其他机器学习方法相比，比如监督式学习、迁移学习、甚至非监督式学习学习相比，深度强化学习方法极其需要大量数据，而且常常不稳定，从性能上来说可能不是最好的选择。 RL一直以来只成功地应用于那些可以根据需要生成大量模拟数据阅读全文

posted @ 2019-07-15 18:33 qiynet 阅读(694) 评论(0) 推荐(0)

【转载】再励学习面试真题（强化学习面试真题）

摘要：原文地址： https://zhuanlan.zhihu.com/p/33133828 （本文最开始写在WPS里，往知乎粘贴后格式和高亮都没有了。大家可以从CSDN再励学习面试真题-CSDN下载下载本文。百度文库、道客巴巴强行不让公开。）前言本人于17年4月对再励学习产生了兴趣，8月将其定为自己阅读全文

posted @ 2019-07-15 16:08 qiynet 阅读(503) 评论(0) 推荐(0)