2012年8月6日

摘要: 数据训练时分为训练集和测试集,在训练集上训练模型得到的误差叫做test err,在测试集上测试得到的误差就做test err。 我们最终的目标是在训练集上的test err足够小,这样表示模型能很好的fit这个类型的数据。 对于上节中的最小二乘问题,有如下等式: 模型复杂度(complexity)即是描述训练误差和测试误差的不同的工具。 泛化(由训练集到测试集)误差:在很大的... 阅读全文
posted @ 2012-08-06 21:48 yinxs 阅读(406) 评论(0) 推荐(0)
摘要: 线性回归问题是机器学习中的基本问题。线性回归模型解决的是给定输入X,返回Y的过程,这里的Y一般都是连续的变量。 从一般的函数观点来看,线性回归就是找到一个函数,通过观测数据x,可以获得解y,而如此得到的对可以对原始数据拟合的很好。 在统计模型来看,有如下公式: 其中W是参数,b是截距,是噪声。X不是普通意义上的自变量,可以看做由自变量构成的一些特征,视为会更合适。所以线性回归使之参数... 阅读全文
posted @ 2012-08-06 21:44 yinxs 阅读(270) 评论(0) 推荐(0)

导航