摘要: SGD 中 stochastic 什么意思: Mini-Batch。。。 随机梯度下降算法(SGD)是mini-batch GD的一个特殊应用。SGD等价于b=1的mini-batch GD。即,每个mini-batch中只有一个训练样本。full batch GD每一轮迭代需要所有样本参与,对于大 阅读全文
posted @ 2017-06-27 03:02 hahahaf 阅读(560) 评论(0) 推荐(0)