机器学习知识总结——过拟合和欠拟合

所谓过拟合就是指在验证集和训练集上表现很好，但是在测试集上表现很差，也就是说泛化能力差。一般表现为: 高方差，低偏差

欠拟合是指模型在训练集、验证集和测试集上表现都不好

在原始的损失函数后面加一个L1正则化项，即全部权重\(\omega\)的绝对值的和，在乘以\(\lambda/n\)

\[C=C_0+\frac\lambda n\sum_i|\omega_i| \]

对应梯度

\[\frac{\partial C}{\partial\omega}=\frac{\partial C_0}{\partial\omega}+\frac\lambda nsgn(\omega) \]

其中\(sgn(\omega)\)知识简单地取\(\omega\)各个元素地正负号

\[sgn(\omega)= \begin{cases} 1,&\omega>0\\ 0,&\omega=0\\ -1,&\omega<0 \end{cases} \]

L2正则化通常被称为权重衰减(weight decay)，就是在原始的损失函数后面再加上一个L2正则化项，即全部权重\(\omega\)的平方和，在乘以\(\lambda/2n\)。

\[C=C_0+\frac\lambda{2n}\sum_i{\omega^2_i} \]

对应梯度

\[\frac{\partial C}{\partial\omega}=\frac{\partial C_0}{\partial\omega}+\frac\lambda n\omega \]

如有错误，欢迎指正。谢谢

posted @ 2021-01-26 09:11 xiaoxia0722 阅读(393) 评论(0) 收藏举报

刷新页面返回顶部

小夏722