2020 年 4月 5 日随笔档案 - 煦阳

2020年4月5日

摘要： [TOC] ML Agents（五）GridWorld GridWorld这个例子比较有意思，它还是运用了Reinforcement Learning来进行学习的，不同的是它运用了视觉观察值（Visual Observations）来训练agent。如上图所示，Agent就是蓝色的方块，每次它可阅读全文

posted @ 2020-04-05 21:22 煦阳阅读(3619) 评论(8) 推荐(0) 编辑

煦阳

公告