会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
点此进入CSDN
你的浏览器不支持播放哦!!nuttertools 您的浏览器不支持该播放!
高颜值的殺生丸
博主擅长python和c++,从事人工智能领域自然语言处理和图像识别方面的工作,欢迎大家来讨论交流
博客园
首页
联系
管理
2024年5月12日
策略梯度玩 cartpole 游戏,强化学习代替PID算法控制平衡杆
摘要: cartpole游戏,车上顶着一个自由摆动的杆子,实现杆子的平衡,杆子每次倒向一端车就开始移动让杆子保持动态直立的状态,策略函数使用一个两层的简单神经网络,输入状态有4个,车位置,车速度,杆角度,杆速度,输出action为左移动或右移动,输入状态发现至少要给3个才能稳定一会儿,给2个完全学不明白,给
阅读全文
posted @ 2024-05-12 17:00 高颜值的殺生丸
阅读(397)
评论(0)
推荐(2)
作者信息
昵称:
刘新宇
园龄:4年6个月
粉丝:1209
QQ:522414928