2013 年 7月随笔档案 - 虚若怀谷

支持向量机（五）SMO算法

摘要：11 SMO优化算法（Sequential minimal optimization）SMO算法由Microsoft Research的John C. Platt在1998年提出，并成为最快的二次规划优化算法，特别针对线性SVM和数据稀疏时性能更优。关于SMO最好的资料就是他本人写的《Sequential Minimal Optimization A Fast Algorithm for Training Support Vector Machines》了。我拜读了一下，下面先说讲义上对此方法的总结。首先回到我们前面一直悬而未解的问题，对偶函数最后的优化问题：要解决的是在参数上求最大值W的问题阅读全文

posted @ 2013-07-31 22:04 虚若怀谷阅读(314) 评论(0) 推荐(0)

支持向量机（四）

摘要：9 规则化和不可分情况处理（Regularization and the non-separable case）我们之前讨论的情况都是建立在样例线性可分的假设上，当样例线性不可分时，我们可以尝试使用核函数来将特征映射到高维，这样很可能就可分了。然而，映射后我们也不能100%保证可分。那怎么办呢，我们需要将模型进行调整，以保证在不可分的情况下，也能够尽可能地找出分隔超平面。看下面两张图：可以看到一个离群点（可能是噪声）可以造成超平面的移动，间隔缩小，可见以前的模型对噪声非常敏感。再有甚者，如果离群点在另外一个类中，那么这时候就是线性不可分了。这时候我们应该允许一些点游离并在在模型中违背限制条件（阅读全文

posted @ 2013-07-31 21:56 虚若怀谷阅读(214) 评论(0) 推荐(0)

支持向量机（三）核函数

摘要：7 核函数（Kernels）考虑我们最初在“线性回归”中提出的问题，特征是房子的面积x，这里的x是实数，结果y是房子的价格。假设我们从样本点的分布中看到x和y符合3次曲线，那么我们希望使用x的三次多项式来逼近这些样本点。那么首先需要将特征x扩展到三维，然后寻找特征和结果之间的模型。我们将这种特征变换称作特征映射（feature mapping）。映射函数称作，在这个例子中我们希望将得到的特征映射后的特征应用于SVM分类，而不是最初的特征。这样，我们需要将前面公式中的内积从，映射到。至于为什么需要映射后的特征而不是最初的特征来参与计算，上面提到的（为了更好地拟合）是其中一个原因，另外的一个重要原阅读全文

posted @ 2013-07-31 21:16 虚若怀谷阅读(257) 评论(0) 推荐(0)

支持向量机SVM（一）

摘要：【转载请注明出处】http://www.cnblogs.com/jerrylead1 简介支持向量机基本上是最好的有监督学习算法了。最开始接触SVM是去年暑假的时候，老师要求交《统计学习理论》的报告，那时去网上下了一份入门教程，里面讲的很通俗，当时只是大致了解了一些相关概念。这次斯坦福提供的学习材料，让我重新学习了一些SVM知识。我看很多正统的讲法都是从VC 维理论和结构风险最小原理出发，然后引出SVM什么的，还有些资料上来就讲分类超平面什么的。这份材料从前几节讲的logistic回归出发，引出了SVM，既揭示了模型间的联系，也让人觉得过渡更自然。2 重新审视logistic回归Logisti 阅读全文

posted @ 2013-07-30 14:05 虚若怀谷阅读(232) 评论(0) 推荐(0)

支持向量机SVM（二）

摘要：【转载请注明出处】http://www.cnblogs.com/jerrylead6 拉格朗日对偶（Lagrange duality）先抛开上面的二次规划问题，先来看看存在等式约束的极值问题求法，比如下面的最优化问题：目标函数是f(w)，下面是等式约束。通常解法是引入拉格朗日算子，这里使用来表示算子，得到拉格朗日公式为 L是等式约束的个数。然后分别对w和求偏导，使得偏导数等于0，然后解出w和。至于为什么引入拉格朗日算子可以求出极值，原因是f(w)的dw变化方向受其他不等式的约束，dw的变化方向与f(w)的梯度垂直时才能获得极值，而且在极值处，f(w)的梯度与其他等式梯度的线性组合平行，因阅读全文

posted @ 2013-07-30 11:09 虚若怀谷阅读(300) 评论(0) 推荐(0)

OWLQN算法

摘要：一、BFGS算法算法思想如下： Step1 取初始点，初始正定矩阵，允许误差，令； Step2 计算； Step3 计算，使得； Step4 令； Step5 如果，则取为近似最优解；否则转下一步； Step6 计算，，令，转Step2.优点：1、不用直接计算Hessian矩阵；2、通过迭代的方式用一个近似矩阵代替Hessian矩阵的逆矩阵。缺点：1、矩阵存储量为，因此维度很大时内存不可接受；2、矩阵非稀疏会导致训练速度慢。二、L-BFGS算法针对BFGS的缺点，主要在于如何合理的估计出一个Hessian矩阵的逆矩阵，L-BFGS的基本思想是只保存最近的m次迭代信息，从而大大降低数据存储阅读全文

posted @ 2013-07-29 11:52 虚若怀谷阅读(6939) 评论(1) 推荐(0)

pongo英雄会-幸运数题解

摘要：显然我们只要知道1~x范围有多少幸运数（用f(x)表示），lucky(x,y)=f(y)-f(x-1).解法1. 计算排列数由于y#include#include#include#includeusing namespace std;bool isPrime(int n){ if(n0) { digit[n++]=x%10; x/=10; } int n1=0,n2=0,s1,s2,ans=0; for(i=n-1;i>0;i--) { for(j=0;j#include #include #include #inc... 阅读全文

posted @ 2013-07-18 11:43 虚若怀谷阅读(244) 评论(0) 推荐(0)

求最大公约数的算法

摘要：更相减损术更相减损术,又称"等值算法"关于约分问题,实质是如何求分子,分母最大公约数的问题。《九章算术》中介绍了这个方法,叫做”更相减损术”,数学家刘徽对此法进行了明确的注解和说明,是一个实用的数学方法。例：今有九十一分之四十九,问约之得几何?我们用(91,49)表示91和49的最大公约数.按刘徽所说,分别列出分子,分母。“以少减多,更相减损,求其等也,以等数约之,等数约之,即除也,其所以相减者皆等数之重叠,故以等数约之。”译文如下：约分的法则是：若分子、分母均为偶数时，可先被2除，否则，将分子与分母之数列在它处，然后以小数减大数，辗转相减，求它们的最大公约数，用最大公约数阅读全文

posted @ 2013-07-11 11:24 虚若怀谷阅读(440) 评论(0) 推荐(0)

虚若怀谷

07 2013 档案