Foch155

导航

2017年11月19日 #

AlphaGo原理浅析

摘要: 一、PolicyNetwork(走棋网络) 首先来讲一下走棋网络。我们都知道,围棋的棋盘上有19条纵横交错的线总共构成361个交叉点,状态空间非常大,是不可能用暴力穷举的方式来模拟下棋的。但是我们可以换一种思路,就是让计算机来模拟职业棋手来下棋。DeepMind团队首先想到的是用深度卷积神经网络,即 阅读全文

posted @ 2017-11-19 22:12 Foch155 阅读(2537) 评论(0) 推荐(0) 编辑