摘要: Part I:Tabular Solution Methods 在这一部分中我们描述了强化学习中几乎所有的核心思想。在这些问题中state和action空间足够小可以被值函数如表格来展示。在这些例子中,都能准确地找到最佳值函数和最佳策略。这与下一部分是不同的,下一部分讲的是模糊的解决,但适用范围更广 阅读全文
posted @ 2020-12-25 22:12 invincible~ 阅读(733) 评论(0) 推荐(0)
摘要: t# linux基础 由来 1965年,MIT 通用电气 贝尔实验室联合开发Multics工程计划。但是目标过于庞大复杂,最后贝尔实验室宣布推出 1969年,贝尔实验室中的肯·汤普森在DEC PDP-7机器上开发了UNIX系统 1971年,肯·汤普森的同事丹尼斯·里奇发明了C语言; 1973年uni 阅读全文
posted @ 2020-12-25 15:24 invincible~ 阅读(61) 评论(0) 推荐(0)
摘要: 机器学习基础 阅读全文
posted @ 2020-12-25 15:02 invincible~ 阅读(74) 评论(0) 推荐(0)