摘要: 批量归一化层和 dropout 层一样,在训练模式和预测模式下计算不同 阅读全文
posted @ 2021-05-06 17:12 哈哈哈喽喽喽 阅读(53) 评论(0) 推荐(0)
摘要: 主要作用是:训练深层神经网络是十分困难的,特别是在较短的时间内使他们收敛更加棘手,可持续加速深层网络的收敛速度。 怎么达到加速深层网络的收敛速度: 1、数据的预处理影响收敛速度和调参难度,比较明显的例子是线性回归,如果特征量纲差别特别大,他的斜率可能近视90度或者0度,收敛速度和调参是比较困难的。B 阅读全文
posted @ 2021-05-06 17:07 哈哈哈喽喽喽 阅读(512) 评论(0) 推荐(0)