Manifold Learning: ISOMAP

转：http://hi.baidu.com/chb_seaok/item/faa54786a3ddd1d7d1f8cd0b

在常见的降维方法中，PCA和LDA是最为常用的两种降维方法。PCA是一种无监督方法，它关注的是将数据沿着方差最大化的方向映射。而LDA是一种监督方法，它寻找映射轴（类之间耦合度低，类内的聚合度高），两种方法估计的都是全局的统计信息（均值和协方差）。

manifold learning是最近比较热门的领域，它是一种非线性降维技术，主要研究的是高维数据的潜在的流行结构。首先我们来看下为什么要进行流行学习，先看经典图：

图1

数据在高维空间空间中，什么事合理的距离度量（两个点之间的距离）成了关键，如图1，如果我们用欧式距离分别来度量图中红点与蓝点和黄点的距离的话，红点与蓝点的距离应该较红点与黄点距离远。事实上是否如此的，该距离是否真实的反应了数据之间的距离关系呢？想象力丰富的同学可能可以看出来，这些数据像一条丝带，把他在一个平面内展开，再去度量红点与蓝点和黄点的距离是否更为合理些？

ISOMAP是manifold learning的最为常见的一种方法，它主要的思想是用n维的欧式空间近似于一个N维的流行(n<<N).

第一步：构建点的邻居