(180923)通过正则化降低特征组合过度模型过于复杂---机器学习速成

正则化的提出同样是解决模型过拟合问题，之前提出的特征组合来训练模型，当训练次数足够多时，损失会降低到非常的低，但却会出现过拟合问题。如图

迭代次数足够多，模型的复杂度也越高。可见一个好的模型和损失、模型的复杂度都有关。

所以，训练优化算法是一个由两项内容组成的函数：一个是损失项，用于衡量模型与数据的拟合度，另一个是正则化项，用于衡量模型复杂度。

所以，什么是正则化？ 降低复杂模型的复杂度来避免过拟合的原则就是正则化。

对于第一种方式（特征的权重的函数），权重的绝对值越高，对复杂度的贡献越大。

L2正则化（也称岭正则化）：所有权重的平方和，对权重的平方和的惩罚。

重新定义算法，在损失函数的基础上添加惩罚项（损失 + λ * 惩罚）。

执行 L2 正则化对模型具有以下影响

λ，正则化率。增大，会增强正则化的效果，但往往会造成欠拟合问题；减小，会出现过拟合问题。如何选择，依据训练的数据而定。

注意的是学习速率和λ不是对等的概念，但关系紧密。

测试中提及，将正则化率从 0 增至 0.3 （从0增大）会产生以下影响：

注意：虽然测试损失明显减少，训练损失实际上却有所增加。这属于正常现象，因为您向损失函数添加了另一项来降低复杂度。最终，最重要的是测试损失，因为它是真正用于衡量模型能否针对新数据做出良好预测的标准。

由于数据集具有随机性，因此无法预测哪个正则化率能得出最准确的结果。对我们来说，正则化率为 0.3 或 1 时，一般测试损失降至最低。

posted @ 2018-09-23 19:12 不知道的痛阅读(365) 评论(0) 收藏举报

刷新页面返回顶部

不知道的痛