摘要: # Lecture 1:概括与基础 和 supervised learning 的区别: * 强化学习是Sequential data作为input,每次输入并不是独立同分布 * 没有ground truth, learner不会被告知什么action是正确的。需要不断去尝试 * Trail-and 阅读全文
posted @ 2022-06-25 01:05 耿逸然 阅读(129) 评论(0) 推荐(0)