2021 年 3月 23 日随笔档案 - 黎明程序员

2021年3月23日

摘要：目录摘要围棋的困难点分析如何绕过困难点 AlphaGo思想简介网络训练流程分析 1.策略网络的监督学习 2.策略网络的强化学习 3.价值网络的强化学习 4.策略网络、价值网络联合MCTS AlphaGo算法小结 AlphaGo棋力评估 Discussion AlphaGo中MCTS的细节* 阅读全文

posted @ 2021-03-23 23:09 黎明程序员阅读(726) 评论(0) 推荐(0) 编辑

黎明程序员

公告