pca学习总结

PCA的计算过程大致可以分为以下几步:

(1)求特征向量的均值,然后每个样例减去对应的均值

(2)求特征的协方差矩阵,若协方差大于0,表示一个增,另一个也增;若协方差小于0,表示一个增,一个减,若协方差等于0,表示两者独立,协方差的绝对值越大,表示两者对彼此的影响越大,反之越小。

(3)根据协方差矩阵,求协方差矩阵的特征值和特征向量,通常情况下会将特征向量归一化为单位向量;

(4)将特征值按照从大到小的顺序排列,选择最大的K个,然后将其对应的特征向量分别作为列向量组成特征向量矩阵

(5)将样本点投影到选取的特征向量上;

PCA的计算过程就是数据降维的过程,降维的过程中:

  样本矩阵:m*n

特征向量:n*k

则投影后的矩阵为:(m*n)*(n*k)=m*k

则数据变成了K维的数据。

posted @ 2016-03-28 14:06  贾慧玉  阅读(147)  评论(0)    收藏  举报