强化学习-ddpg算法

这个算法应用最多 Deep Deterministic Policy Gradient(DDPG)，收集资料学习一下。

例子代码 https://keras.io/examples/rl/ddpg_pendulum/
算法解读 http://www.cs.sjsu.edu/faculty/pollett/masters/Semesters/Spring18/ujjawal/DDPG-Algorithm.pdf

posted @ 2021-12-28 14:33 bregman 阅读(181) 评论(0) 收藏举报

刷新页面返回顶部