02 2019 档案
摘要:课件 : "Lecture 2: Markov Decision Processes" 视频 : "David Silver深度强化学习第2课 简介 (中文字幕)" 马尔可夫过程 马尔可夫决策过程简介 马尔可夫决策过程(Markov Decision Processes, MDPs) 形式上用来描述
阅读全文
摘要:课件 : "Lecture 1: Introduction to Reinforcement Learning" 视频 : "David Silver深度强化学习第1课 简介 (中文字幕)" 强化学习的特征 作为机器学习的一个分支,强化学习主要的特征为: 无监督,仅有奖励信号; 反馈有延迟,不是瞬时
阅读全文

浙公网安备 33010602011771号