02 2019 档案

摘要:课件 : "Lecture 2: Markov Decision Processes" 视频 : "David Silver深度强化学习第2课 简介 (中文字幕)" 马尔可夫过程 马尔可夫决策过程简介 马尔可夫决策过程(Markov Decision Processes, MDPs) 形式上用来描述 阅读全文
posted @ 2019-02-28 13:22 orzyt 阅读(1078) 评论(0) 推荐(0)
摘要:课件 : "Lecture 1: Introduction to Reinforcement Learning" 视频 : "David Silver深度强化学习第1课 简介 (中文字幕)" 强化学习的特征 作为机器学习的一个分支,强化学习主要的特征为: 无监督,仅有奖励信号; 反馈有延迟,不是瞬时 阅读全文
posted @ 2019-02-26 22:05 orzyt 阅读(883) 评论(0) 推荐(0)