会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
【B站:水论文的程序猿】
道阻且长,与君共勉
首页
新随笔
联系
管理
2021年11月22日
实例:([Flappy Bird Q-learning]
摘要: 实例:(Flappy Bird Q-learning) 问题分析 让小鸟学习怎么飞是一个强化学习(reinforcement learning)的过程,强化学习中有状态(state)、动作(action)、奖赏(reward)这三个要素。智能体(Agent,在这里就是指我们聪明的小鸟)需要根据当前状
阅读全文
posted @ 2021-11-22 08:56 B站-水论文的程序猿
阅读(320)
评论(0)
推荐(0)
公告