深度学习复习总览(四)

深度模型优化与正则化:

  1. 网络优化
    目的:经验风险最小化。对于低维来说,目的是逃离局部最优点;对于高维来说,则是逃离鞍点。

  2. 梯度下降
    批量梯度下降、小批量梯度下降、随机批量梯度下降。
    在这里插入图片描述

  3. 学习率
    在这里插入图片描述
    流程:学习率预热、学习率衰减、学习率周期调整、自适应学习率。
    1)学习率预热:

posted @ 2020-10-18 21:29  小小新一枚  阅读(11)  评论(0)    收藏  举报  来源