摘要: 《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》 随机梯度是训练深度网络的主流方法。尽管随机梯度下降法对于训练深度网络简单高效,但是它有个毛病,就是需要我们人为 阅读全文
posted @ 2017-12-16 10:11 Qniguoym 阅读(235) 评论(0) 推荐(0)