机器学习笔记(五)线性回归
一、线性回归问题
输入的是特征向量,输出为实数,对于
,
,模型函数为
衡量误差为平方错误
,则Ein为
,
Eout为未来没有看过的数据资料在模型函数上所得的错误
二、线性回归算法
由Ein可得
目的是求得Ein最小
,可知在最低点时Ein最小,即梯度为0的时候
由
,
如同
,可知
其中
令
,可得
输入矩阵X在很少的情况下才是方阵(N=d+1时),
在大部分的情况下是可逆的,原因是在进行机器学习时,通常满足
,即样本数量N远远大于样本的维度d加1,因此在
中存在足够的自由度使其可以满足可逆的条件。
另一种是
不可逆的情况,实际上可以得到许多满足条件的解,只需要通过其他的方式求解出
,选择其中一个满足
条件的解。
三、错误分析
由0/1错误和平方错误知,
,对于分类来说

无论y=+1还是y=-1,都可知
所以
0/1错误难以求得合适的解,放宽条件可以求平方错误来衡量Ein的大小,从而算法可以得出合适的模型函数。
浙公网安备 33010602011771号