激活函数之线性整流单元ReLU

线性整流单元(Rectified Linear Unit，ReLU) 是深度学习中最广泛使用的激活函数之一。它因其简单、高效的特性，成为大多数现代神经网络（特别是卷积神经网络 CNN）隐藏层的默认选择。

ReLU 激活函数的作用是给神经网络引入非线性，使其能够学习和逼近复杂的数据模式。

其数学表达式非常简单：𝑓(𝑥)=max(0,𝑥)

这意味着：

ReLU 之所以被广泛采用，主要得益于以下几个显著优势：

计算高效： 相比于 Sigmoid 或 Tanh 函数涉及复杂的指数运算，ReLU 只需要进行简单的阈值判断（取最大值），计算速度非常快，有助于加速训练和推理过程。
解决梯度消失问题： 对于正数输入 (𝑥>0)，ReLU 的导数恒定为 1。这确保了在反向传播过程中，梯度可以有效地流动到网络的更深层，从而缓解了深层网络中常见的梯度消失问题。
引入稀疏性： 由于负值输入会被直接置为 0，网络中的部分神经元处于非激活状态。这种稀疏激活（Sparse Activation）有助于生成稀疏表示，减少计算量，并且具有正则化的效果，有助于防止过拟合。