摘要: 一、梯度消失与梯度爆炸 1、在DNN学习(二)反向传播中,观察公式三(3),为了求隐藏层参数的其中一步。根据链式法则,有 $$\displaystyle{\displaylines{\frac{\partial J_{o1}}{\partial O_{h1}}=\frac{\partial J_{o 阅读全文
posted @ 2018-12-25 11:50 ylxn 阅读(854) 评论(0) 推荐(0)