摘要: WeTest 导读 本文主要介绍如何让AI在24分钟内学会玩飞车类游戏。我们使用Distributed PPO训练AI,在短时间内可以取得不错的训练效果。 本方法的特点: 1. 纯游戏图像作为输入 2. 不使用游戏内部接口 3. 可靠的强化学习方法 4. 简单易行的并行训练 1. PPO简介 PPO 阅读全文
posted @ 2019-01-22 12:58 腾讯WeTest 阅读(1849) 评论(5) 推荐(8)