机器学习笔记(八)非线性变换

一、非线性问题

对于线性不可分的数据资料,用线性模型分类,Ein会很大,相应的Ein=Eout的情况下,Eout也会很大,导致模型表现不好,此时应用非线性模型进行分类,例如:

分类器模型是一个圆形,假设模型可表示为

转化表示形式

将平方项和常数项转为一次的Z项,则将非线性的特征空间转化为线性的特征空间

可以用线性模型进行分类

二、非线性转换

对于把Q次方的多项式进行全部的一次转换,转换的项数一共为,转换过后的一次模型的dvc等于总的项数,

总的项数为,其中d为特征向量的长度

选择合适的转换项数,项数越多代表模型越复杂,但不要为了减少dvc,人为的在脑袋里加工转换特征,例如

在上述各种转化中,有dvc为2的甚至为1的,但都是进过自己脑海中转化过的特征,不可取

对于不同的Q次方的情况,有如下结果:

,高次对低次具有包含的关系

Ein随着Q的次方增大会减少,但过高的Q次方会带来Eout的增大,不具有泛化能力,做模型建立是首先考虑线性的模型,如果它做的好的话那就很好(Ein和Eout都很小),若不好(Ein始终很大),在选择高次方的模型

 

posted on 2017-05-11 21:02  水涵空  阅读(570)  评论(0)    收藏  举报