摘要: [TOC] ML Agents(五)GridWorld GridWorld这个例子比较有意思,它还是运用了Reinforcement Learning来进行学习的,不同的是它运用了视觉观察值(Visual Observations)来训练agent。 如上图所示,Agent就是蓝色的方块,每次它可 阅读全文
posted @ 2020-04-05 21:22 煦阳 阅读(3619) 评论(8) 推荐(0) 编辑