python PCA

主要的步骤:

转载至:http://www.cnblogs.com/chenbjin/p/4200790.html?utm_source=tuicool&utm_medium=referral

1.数据中心化,均值为0,方差为1(目的:协方差矩阵表示的为方差,方差为1,消除量纲影响(由于最大化方差,主要针对量纲不同的数据),即为标准化)

2.求取xx的特征值和特征向量

3.排序特征值,进行筛选,从而筛选出相应的特征向量

4.标准化后数据乘以选出的特征向量(从而原始数据映射到低维度的空间)

5.为了将原始数据与降维后的数据进行比较,所以将降维后数据乘以选取的特征向量的逆+均值(如果前期是标准化的则应该乘以方差+均值),从而得到可以与原始数据进行对比的降维后的数据(选取了部分的特征)

特征向量表示映射的维度,特征值表示矩阵在特征向量方向下的拉伸大小,则可以理解为在该维度下的方差大小。或者按照力的分解的方式进行理解(自己理解的),特征值为在相应方向上(特征向量方向)力的大小。

sklearn中的PCA的调用:

http://blog.csdn.net/u012162613/article/details/42192293

posted on 2017-11-04 17:05  湘雨jay  阅读(374)  评论(0编辑  收藏  举报