线性回归算法原理推导

机器学习的有监督算法分为分类和回归两种。

一、线性回归

　　现在这里有一个例子
　　数据：工资和年龄（2个特征）
　　目标：预测银行会贷款给我多少钱（标签）
　　考虑：工资和年龄都会影响最终银行贷款的结果那么它们各自有多大的影响呢？（参数）

　　输入为工资和年龄，输出为银行贷款的额度。那么输入和输出到底有什么关系呢？

　　假设X₁,X₂就是我们的两个特征（年龄，工资），Y是银行最终会借给我们多少钱

　　线性回归呢就是找到最合适的一条线（想象一个高维）来最好的拟合我们的数据点，那么这个地方因为自变量涉及两个，所以最终目的就是找出一个拟合平面。

　　那么现在继续假设θ₁是年龄的参数， θ₂是工资的参数。那么拟合的平面表达式为(θ₀为偏置项，θ₁、θ₂为权重参数)：

　　这里的话总共有两个特征，那么当有n个特征的时候的表达式为(θ₀对应的X₀全为1)：

　　真实值和预测值之间肯定是要存在差异的（用 ε 来表示该误差），而对于每个样本来说，真实值等于预测值加上误差值，公式表达为：

　　预测值与误差：

　　由于误差服从高斯分布：

　　将两个式子整合得到：

　　似然函数(什么样的参数跟我们的数据组合后（这个组合后的值就是预测值）恰好是真实值)，最大似然估计(参数跟数据组合后恰好是真实值的概率是最大的)，下面两个竖线数学符号的意思是进行累乘。

　　对数似然(乘法理解，加法就容易了，对数里面乘法可以转化成加法)：

　　对上面的对数似然进行整合可以得到：

　　我们的最终目标就是让似然函数（对数似然也是一样）越大越好，因为上面这个式子，前半部分是恒大于0的且是常数，后半部分也是恒大于0的，所以要保持整个式子最大，就只有让后半部分越小越好。于是可以得到：

　　那下面的过程就是怎么样才能求解使得上面这个式子的值越小越好呢？

　　这上面的推导过程表示并没有看得太懂哈哈哈。但是结果表示当θ取这个值的时候，整体的偏导等于0，而偏导等于0是极小值点，至于为什么是极小值点，涉及机器学习中的凸优化问题。

posted @ 2019-07-03 22:08 |旧市拾荒| 阅读(1344) 评论(0) 收藏举报

刷新页面返回顶部