上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 61 下一页
摘要: 强化学习从基础到进阶-案例与实践[5.1]:Policy Gradient策略梯度-Cart pole游戏展示 阅读全文
posted @ 2023-06-30 15:53 汀、人工智能 阅读(71) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[8]:近端策略优化(proximal policy optimization,PPO)算法 阅读全文
posted @ 2023-06-28 18:56 汀、人工智能 阅读(182) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶--案例与实践[7.1]:深度确定性策略梯度DDPG算法、双延迟深度确定性策略梯度TD3算法详解项目实战 阅读全文
posted @ 2023-06-27 23:20 汀、人工智能 阅读(163) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[7]:深度确定性策略梯度DDPG算法、双延迟深度确定性策略梯度TD3算法详解 阅读全文
posted @ 2023-06-27 23:19 汀、人工智能 阅读(160) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[6]:演员-评论员算法(advantage actor-critic,A2C),异步A2C、与生成对抗网络的联系等详解 阅读全文
posted @ 2023-06-26 22:56 汀、人工智能 阅读(245) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[5]::梯度策略、添加基线(baseline)、优势函数、动作分配合适的分数(credit) 阅读全文
posted @ 2023-06-25 20:23 汀、人工智能 阅读(229) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-案例与实践[4.1]:深度Q网络-DQN项目实战CartPole-v0 阅读全文
posted @ 2023-06-24 23:42 汀、人工智能 阅读(222) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[4]::深度Q网络-DQN、double DQN、经验回放、rainbow、分布式DQN 阅读全文
posted @ 2023-06-24 23:41 汀、人工智能 阅读(313) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[3]:表格型方法:Sarsa、Qlearning;蒙特卡洛策略、时序差分等以及Qlearning项目实战 阅读全文
posted @ 2023-06-23 15:33 汀、人工智能 阅读(95) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-案例与实践[3]:表格型方法:Sarsa、Qlearning;蒙特卡洛策略、时序差分等以及Qlearning项目实战 阅读全文
posted @ 2023-06-23 15:30 汀、人工智能 阅读(497) 评论(0) 推荐(0)
上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 61 下一页