LEARNING TO NAVIGATE IN COMPLEX ENVIRONMENTS

任务是地图里面导航,让agent从起始点到达指定位置。

 

用了supervised learning + reinforcement learning + lstm

 

用supervised learning当做辅助训练,加速rl训练,用lstm当做memory。实验表明depth construction比较有用。论文中的方法在固定地图和随机地图中都能用。

 

posted @ 2018-03-12 14:55  Shiyu_Huang  阅读(586)  评论(0编辑  收藏  举报