摘要: 实例:(Flappy Bird Q-learning) 问题分析 让小鸟学习怎么飞是一个强化学习(reinforcement learning)的过程,强化学习中有状态(state)、动作(action)、奖赏(reward)这三个要素。智能体(Agent,在这里就是指我们聪明的小鸟)需要根据当前状 阅读全文
posted @ 2021-11-22 08:56 B站-水论文的程序猿 阅读(320) 评论(0) 推荐(0)