摘要: 随机梯度下降法(SGD)是训练深度学习模型最常用的优化方法。在前期文章中我们讲了梯度是如何计算的,主要采用BP算法,或者说利用链式法则。但是深度学习模型是复杂多样的,你不大可能每次都要自己使用链式法则去计算梯度,然后采用硬编程的方式实现。 而目前的深度学习框架其都是实现了自动求梯度的功能,你只关注模 阅读全文
posted @ 2019-10-27 10:48 TIMLONG 阅读(2398) 评论(0) 推荐(0)