摘要: 1为什么出现: 并非网络结构越深,效果越好。随着网络结构的加深,模型的性能会逐渐提升,到某个最优点后,反而会下降。 重要的是,这并不仅仅是过拟合,因为即使在训练集上,更深の网络的误差也更高。这意味着更深的网络甚至无法很好地学习。 如果模型最优点是星星的话,像图1来说,最后会离最优点越来越远。 所以只 阅读全文
posted @ 2025-09-22 21:28 朱朱成 阅读(29) 评论(0) 推荐(0)
摘要: 1. 是什么 想象一下,正在训练一个很深的神经网络,比如有几十层。网络的每一层都在学习如何将输入数据变换成对最终任务更有用的表示。 现在,考虑第10层。它的输入来自于第9层的输出。在训练过程中,由于反向传播和梯度下降,第1层到第9层的所有参数(权重和偏置)都在不停地更新。这意味着,对于第10层来说, 阅读全文
posted @ 2025-09-22 21:25 朱朱成 阅读(123) 评论(0) 推荐(0)