摘要:
Part I:Tabular Solution Methods 在这一部分中我们描述了强化学习中几乎所有的核心思想。在这些问题中state和action空间足够小可以被值函数如表格来展示。在这些例子中,都能准确地找到最佳值函数和最佳策略。这与下一部分是不同的,下一部分讲的是模糊的解决,但适用范围更广 阅读全文
posted @ 2020-12-25 22:12
invincible~
阅读(733)
评论(0)
推荐(0)
摘要:
t# linux基础 由来 1965年,MIT 通用电气 贝尔实验室联合开发Multics工程计划。但是目标过于庞大复杂,最后贝尔实验室宣布推出 1969年,贝尔实验室中的肯·汤普森在DEC PDP-7机器上开发了UNIX系统 1971年,肯·汤普森的同事丹尼斯·里奇发明了C语言; 1973年uni 阅读全文
posted @ 2020-12-25 15:24
invincible~
阅读(61)
评论(0)
推荐(0)
摘要:
机器学习基础 阅读全文
posted @ 2020-12-25 15:02
invincible~
阅读(74)
评论(0)
推荐(0)

浙公网安备 33010602011771号