摘要:
最近在搞强化学习(Reinforcement Learning),打算把之前写的笔记整理一下
本文基于大卫 希尔维(David Silver)教授的强化学习概论课程,视频中所采用的样例学生马尔科夫链(Student MDPs)有时间再补上去
出处:[https://www.youtube.com/watch?v=lfHX2hHRMVQ&list=PLqYmG7hTraZDM-OYHWgPebj2MfCFzFObQ&index=2]() 阅读全文
posted @ 2020-09-26 10:04
Uzuki
阅读(874)
评论(0)
推荐(1)

浙公网安备 33010602011771号