2022年11月14日 Batch Normalization

What Is Batch Norm?

Batch Normalization（批标准化）的动机是“内部协变量偏移”，可解决梯度消失和梯度爆炸问题，其本质上就是做特征缩放，将分散的数据做一个统一，让机器学习更容易找到数据之中的规律。

批量标准化（BN）使我们能够选择更高的学习率，从而更快地收敛损失函数，同时可减少对dropout的需求。

注意：

需要较低的学习率和合理的参数初始化来减慢训练速度，并且使得训练具有饱和非线性的模型变得非常困难。换句话说就是数据分布对训练产生了影响。例：

Figure 1

(a) 使用和不使用 Batch Normalization 训练的 MNIST 网络的测试准确度与训练步骤的数量。 Batch Normalization 有助于网络更快地训练并获得更高的准确度。
(b, c) 在训练过程中输入分布到典型 sigmoid 的演变，显示为第 {15, 50, 85} 个百分位数。 Batch Normalization 使分布更加稳定，并减少了内部协变量偏移。

Figure 2

Inception及其批量标准化变体的验证准确度与训练步骤数的关系。

Figure 3

对于 Inception 和批量归一化变体，达到 Inception 的最大准确度 (72.2%) 所需的训练步骤数，以及网络达到的最大准确度。

posted @ 2022-11-15 01:05 Kruskal 阅读(12) 评论(0) 编辑收藏举报

刷新页面返回顶部