上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 60 下一页
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[6]:演员-评论员算法(advantage actor-critic,A2C),异步A2C、与生成对抗网络的联系等详解 阅读全文
posted @ 2023-06-26 22:56 汀、人工智能 阅读(224) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[5]::梯度策略、添加基线(baseline)、优势函数、动作分配合适的分数(credit) 阅读全文
posted @ 2023-06-25 20:23 汀、人工智能 阅读(216) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-案例与实践[4.1]:深度Q网络-DQN项目实战CartPole-v0 阅读全文
posted @ 2023-06-24 23:42 汀、人工智能 阅读(216) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[4]::深度Q网络-DQN、double DQN、经验回放、rainbow、分布式DQN 阅读全文
posted @ 2023-06-24 23:41 汀、人工智能 阅读(302) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[3]:表格型方法:Sarsa、Qlearning;蒙特卡洛策略、时序差分等以及Qlearning项目实战 阅读全文
posted @ 2023-06-23 15:33 汀、人工智能 阅读(84) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-案例与实践[3]:表格型方法:Sarsa、Qlearning;蒙特卡洛策略、时序差分等以及Qlearning项目实战 阅读全文
posted @ 2023-06-23 15:30 汀、人工智能 阅读(467) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[2]:马尔科夫决策、贝尔曼方程、动态规划、策略价值迭代 阅读全文
posted @ 2023-06-20 13:10 汀、人工智能 阅读(279) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[1]:强化学习概述、序列决策、动作空间定义、策略价值函数、探索与利用、Gym强化学习实验 阅读全文
posted @ 2023-06-19 13:23 汀、人工智能 阅读(265) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-案例与实践[1]:强化学习概述、序列决策、动作空间定义、策略价值函数、探索与利用、Gym强化学习实验 阅读全文
posted @ 2023-06-19 11:50 汀、人工智能 阅读(634) 评论(0) 推荐(0)
摘要: 全国大数据与计算智能挑战赛:面向低资源的命名实体识别基线方案,排名13/64 阅读全文
posted @ 2023-06-18 13:04 汀、人工智能 阅读(232) 评论(0) 推荐(0)
上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 60 下一页