摘要: 原文书籍链接:http://incompleteideas.net/book/RLbook2018.pdf 0 介绍 part Ⅰ:表格型解决方法 1 多臂赌徒问题(Multi-armed Bandits) 2 有限马尔可夫决策过程(Finite Markov Decision Processes) 阅读全文
posted @ 2020-02-22 17:23 yingfengwu 阅读(577) 评论(0) 推荐(0)