g
y
7
7
7
7
摘要: 之前看强化学习的一些教学视频,发现自己对一些强化学习中符号的定义理解不太透彻,例如 \(Q_{target}\),\(Q值\), \(Q估计\),\(Q现实\),\(Q预测\), 现在发现郭宪老师的书,试读了一下里边的内容,发现老师讲解的很透彻,并且原理解释的很清楚,因此做此笔记。一是为了监督自己的 阅读全文
posted @ 2021-04-16 09:40 gy77 阅读(860) 评论(1) 推荐(0) 编辑