摘要:
最近在在学习强化学习方面的东西, 对于现有的很多文章中关于强化学习的知识很是不理解,很多都是一个公式套一个公式,也没有什么太多的解释,感觉像是在看天书一般,经过了较长时间的挣扎最后决定从一些基础的东西开始入手,于是便有了这篇论文的发现。 Learning from Delayed Reward 该论 阅读全文
posted @ 2019-01-11 20:47
Angry_Panda
阅读(5464)
评论(0)
推荐(0)
浙公网安备 33010602011771号