会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
她说, 她是仙, 她不是神
首页
联系
订阅
管理
强化学习-ddpg算法
这个算法应用最多 Deep Deterministic Policy Gradient(DDPG), 收集资料学习一下。
例子代码
https://keras.io/examples/rl/ddpg_pendulum/
算法解读
http://www.cs.sjsu.edu/faculty/pollett/masters/Semesters/Spring18/ujjawal/DDPG-Algorithm.pdf
--- 她说, 她是仙,她不是神
posted @
2021-12-28 14:33
bregman
阅读(
167
) 评论(
0
)
收藏
举报
刷新页面
返回顶部
公告