2016 年 6月 10 日随笔档案 - AHU-WangXiao

2016年6月10日

摘要： (译) 强化学习第一部分：Q-Learning 以及相关探索 Q-Learning review: Q-Learning 的基础要点是：有一个关于环境状态S的表达式，这些状态中可能的动作 a，然后你学习这些状态下他们action的值。直观的讲，这个值，Q，是状态-动作值(state-action 阅读全文

posted @ 2016-06-10 16:45 AHU-WangXiao 阅读(708) 评论(0) 推荐(0)

The Blog of Xiao Wang

Associate Professor, School of Computer Science and Technology, Anhui University, Email: xiaowang@ahu.edu.cn

公告