神经网络学习率过大导致损失率上升以及loss固定现象解释

一、loss固定的原因:

当输入变量都比较大时，反向传播时梯度值较小使loss无法收敛。

二、学习率过大，损失值上升。

由于平方损失函数是一个二次函数，所以当学习率大时步长大，导致神经网络越迭代损失值越大。

posted @ 2021-11-29 21:26 祥瑞哈哈哈阅读(2656) 评论(0) 收藏举报

刷新页面返回顶部