误差反向传播:
输出层误差:用误差函数对输出层的求导,得到输出层误差
误差反向传播中,输出层误差的核心结论是:输出层误差向量 = 误差函数对输出层神经元输出的偏导数 × 输出层激活函数的导数。
- 误差函数是衡量模型预测值与真实值差异的指标,常见的有均方误差(MSE)、交叉熵误差(CEE)。
- 对输出层每个神经元的输出求偏导,得到 “原始误差信号”,反映该神经元输出对总误差的贡献。
- 乘以输出层激活函数的导数(如 Sigmoid 的 f’(x)=f (x)(1-f (x))、ReLU 的 f’(x)),是为了结合神经元的激活特性,得到最终可用于反向传播的误差项。
- 均方误差(适用于回归任务):若输出层无激活(或激活为恒等函数),误差项 = 预测值 - 真实值。
- 交叉熵误差(适用于分类任务):若输出层激活为 Softmax,误差项 = 预测值 - 真实值(推导后简化结果,无需额外乘激活函数导数)。
======================================================================