汀、人工智能

摘要：强化学习从基础到进阶-案例与实践[5.1]：Policy Gradient策略梯度-Cart pole游戏展示阅读全文

posted @ 2023-06-30 15:53 汀、人工智能阅读(71) 评论(0) 推荐(0)

摘要：强化学习从基础到进阶-常见问题和面试必知必答[8]：近端策略优化（proximal policy optimization，PPO）算法阅读全文

posted @ 2023-06-28 18:56 汀、人工智能阅读(182) 评论(0) 推荐(0)

摘要：强化学习从基础到进阶--案例与实践[7.1]：深度确定性策略梯度DDPG算法、双延迟深度确定性策略梯度TD3算法详解项目实战阅读全文

posted @ 2023-06-27 23:20 汀、人工智能阅读(163) 评论(0) 推荐(0)

摘要：强化学习从基础到进阶-常见问题和面试必知必答[7]：深度确定性策略梯度DDPG算法、双延迟深度确定性策略梯度TD3算法详解阅读全文

posted @ 2023-06-27 23:19 汀、人工智能阅读(160) 评论(0) 推荐(0)

摘要：强化学习从基础到进阶-常见问题和面试必知必答[6]：演员-评论员算法（advantage actor-critic，A2C），异步A2C、与生成对抗网络的联系等详解阅读全文

posted @ 2023-06-26 22:56 汀、人工智能阅读(245) 评论(0) 推荐(0)

摘要：强化学习从基础到进阶-常见问题和面试必知必答[5]：：梯度策略、添加基线（baseline）、优势函数、动作分配合适的分数（credit）阅读全文

posted @ 2023-06-25 20:23 汀、人工智能阅读(229) 评论(0) 推荐(0)

摘要：强化学习从基础到进阶-案例与实践[4.1]：深度Q网络-DQN项目实战CartPole-v0 阅读全文

posted @ 2023-06-24 23:42 汀、人工智能阅读(222) 评论(0) 推荐(0)

摘要：强化学习从基础到进阶-常见问题和面试必知必答[4]：：深度Q网络-DQN、double DQN、经验回放、rainbow、分布式DQN 阅读全文

posted @ 2023-06-24 23:41 汀、人工智能阅读(313) 评论(0) 推荐(0)

摘要：强化学习从基础到进阶-常见问题和面试必知必答[3]：表格型方法：Sarsa、Qlearning；蒙特卡洛策略、时序差分等以及Qlearning项目实战阅读全文

posted @ 2023-06-23 15:33 汀、人工智能阅读(95) 评论(0) 推荐(0)

摘要：强化学习从基础到进阶-案例与实践[3]：表格型方法：Sarsa、Qlearning；蒙特卡洛策略、时序差分等以及Qlearning项目实战阅读全文

posted @ 2023-06-23 15:30 汀、人工智能阅读(497) 评论(0) 推荐(0)

✨汀、