摘要: 目录 摘要 围棋的困难点分析 如何绕过困难点 AlphaGo思想简介 网络训练流程分析 1.策略网络的监督学习 2.策略网络的强化学习 3.价值网络的强化学习 4.策略网络、价值网络联合MCTS AlphaGo算法小结 AlphaGo棋力评估 Discussion AlphaGo中MCTS的细节* 阅读全文
posted @ 2021-03-23 23:09 黎明程序员 阅读(726) 评论(0) 推荐(0) 编辑