过拟合与欠拟合

1. 定义

欠拟合的偏差过大,过拟合的方差过高

上图分别为:欠拟合,正常,过拟合
图片中的是多项式回归任务。图一左边的应该是欠拟合,没有将x与o正确分类,中间的是正常的,右边的是过拟合,原因在与x的n次方中的n这个超参数设置太大,导致对训练数据过于拟合,此时应引入正则化项来惩罚次数较高从而导致过大的系数。图二同理。

2. 方法

解决过拟合的方法:
1、增加训练集样本

2、选择更为合适的特征

3、正则化
正则化的作用是让你保留所有的特征,但防止某些权重过大,这有时会导至过拟合

3. 线性回归的正则化

以线性回归为例,引入正则化的损失函数:

可以想象,当\(\lambda = 0\)时,会发生过拟合;当\(\lambda\)非常大时,会使\(w_1,w_2...\)等均趋于0,拟合出y=b的水平直线。所以选择\(\lambda\)的大小需适中

一般不正则化乘法b,因为影响不大,但是也可以

计算时,式子也会发生变化:

将其代入,得:

4. 逻辑回归的正则化

与线性回归差不多:

posted @ 2023-11-01 17:40  乐池  阅读(70)  评论(0)    收藏  举报