支持向量机SVM

(1)支持向量的基本形式

对于一个分类问题，如果用PLA算法，可能会有多种分类策略，如下图所示，很明显，第三个图是一个最佳的分类策略，因为在第三个图中，边界上的数据允许的测量误差可以更大一些。对未见示例的泛化性更强。这种方法就是支持向量机。

我们想要得到的是找到一条直线能够把样本数据正确的分开，而且，直线与最近的样本数据的距离是最大的。对于一条直线，如果用w=(w₁,w₂,w₃,...,w_n)表示超平面的法向量，决定超平面的方向，超平面可以通过以下的线性方程来描述：

　　w^Tx+b=0

样本到划分超平面的距离是：r=|w^Tx+b|/||w||

因此具有最大间隔的划分超平面是

可以通过等价转换，转化为如下形式：

这就是支持向量机的基本形式。

(2)基本支持向量的求解过程

支持向量机的采用的二次规划方式求解：

其实很简单，就仿照右上式吧左上式转化一下，只要相应的系数对应即可，这时候，即可求出最终的结果，求出w和b得到最终的的结果。

(3)对偶支持向量机(Dual SVM)

对偶是基本支持向量机的一种解答方式，即把线性约束放到优化问题本身中去，采用的方法是拉格朗日求解法，具体的求解过程如下，

-->

将原始问题的形式转化为拉格朗日的形式，如上图所示。接下来就是求解w，b的值使得L(b,w,a)的值最小。这个问题可以按如下形式转化：最大值里的最小值一定大于最小值里边的最大值，如下图所示

.......(1)

根据上边的转化，问题最终转化为如下形式：

下边就是对上式求导，首先对b求导：........(2)

接着就是对w求导：........(3)

将(2)(3)式带入(1)式，即可得到下边的结果：

其中约束条件称为KKT条件，如下

在上边的式子中，当α_n=0时1-y_n(w^TZ_n+b)可以不为0，当α_n≠0时1-y_n(w^TZ_n+b)=0，这个时候对应的(x_n,y_n)为支持向量，根据已知的α求出W，然后根据α_n≠0时1-y_n(w^TZ_n+b)=0，求出一个b。或者取多个b求平均值，这是，就可得到最终的分离平面，由此看见，该平面的产生只与支持向量相关。