2017 年 11月 19 日随笔档案 - Foch155

2017年11月19日 #

AlphaGo原理浅析

摘要：一、PolicyNetwork（走棋网络）首先来讲一下走棋网络。我们都知道，围棋的棋盘上有19条纵横交错的线总共构成361个交叉点，状态空间非常大，是不可能用暴力穷举的方式来模拟下棋的。但是我们可以换一种思路，就是让计算机来模拟职业棋手来下棋。DeepMind团队首先想到的是用深度卷积神经网络，即阅读全文

posted @ 2017-11-19 22:12 Foch155 阅读(2862) 评论(0) 推荐(0)

Foch155

导航

AlphaGo原理浅析