摘要:
Exploration and Exploitation(探索和利用)是强化学习需要去平衡的一个点,即我应该去探索新的选项还是充... 阅读全文
posted @ 2019-08-30 11:41
从流域到海域
阅读(207)
评论(0)
推荐(0)
摘要:
RL Algorithm Components 通常包括一个或者更多: Model(模型): world对agent的动作如何改变的... 阅读全文
posted @ 2019-08-30 10:17
从流域到海域
阅读(86)
评论(0)
推荐(0)

浙公网安备 33010602011771号