君子博学而日参省乎己则知明而行无过矣

公告

最小二乘法的概率解释

最小二乘法简介

最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据，并使得这些求得的数据与实际数据之间误差的平方和为最小。

上面的定义是摘自维基百科，在实际拟合应用中，而我个人直观的理解就是，最小二乘法是一个评价函数(标准)，用来评价我们得到的拟合曲线是否是最好的。最小二乘法的函数表示为:

其中

为什么是这个函数

首先假设我们有这样的数据集:

面对一个高维的拟合问题，我们通常假设一个参数向量

拟合问题的目标就是寻找一个合适的

那么为什么要选择这个函数而不是其他函数呢，为了回答这个问题，我们又要进行假设了，假设输入

其中

所以

所以我们可以得到：

此处

1此处的原文是: “

用

为了最大程度的使拟合符合真实情况，我们尽可能的使

但是公式

2此处利用了对数函数

最终，最大化

总结

本文是根据斯坦福大学的Andrew Ng教授的《机器学习》的公开课整理而成的，首先从假设误差项符合正态分布3

3正态分布真的是一个非常神奇的东西，生活中很多事情背后都隐含着正态分布的身影，更多内容可以查看这里

参考资料

斯坦福《机器学习》公开课第三集及其配套讲义
最小二乘法？为神马不是差的绝对值
维基百科:正态分布

转载自：http://zhouyichu.com/machine-learning/Least-Squares-Probabilistic-Interpretation.html

posted on 2015-07-22 01:22 刺猬的温驯阅读(844) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部