摘要:
批量归一化层和 dropout 层一样,在训练模式和预测模式下计算不同 阅读全文
posted @ 2021-05-06 17:12
哈哈哈喽喽喽
阅读(53)
评论(0)
推荐(0)
摘要:
主要作用是:训练深层神经网络是十分困难的,特别是在较短的时间内使他们收敛更加棘手,可持续加速深层网络的收敛速度。 怎么达到加速深层网络的收敛速度: 1、数据的预处理影响收敛速度和调参难度,比较明显的例子是线性回归,如果特征量纲差别特别大,他的斜率可能近视90度或者0度,收敛速度和调参是比较困难的。B 阅读全文
posted @ 2021-05-06 17:07
哈哈哈喽喽喽
阅读(512)
评论(0)
推荐(0)

浙公网安备 33010602011771号