PCA主成分分析原理随笔

PCA是一种无监督学习的多元统计分析方法,提取多元事物是主要因素揭示其本质特征

 

D(经过预处理白数据)→SD(对数据进行拉伸)→RSD(对数据进行旋转)→D'

数据拉伸方向为方差变化的最大方向:左乘一个S矩阵     S=

 

 

旋转角度为方差最大的角度:在旋转数据后左乘一个R矩阵   R= 

 

 

 

协方差矩阵的特征向量就是R

协方差矩阵C:

1.  λc 特征值:特征值比重为贡献率(整体权重)

2. βc 特征向量:某一新生成的主成分各个属性的权重     

F1 =ω1X1 +ω2X2 +...+ωn Xn                                                 

βc=1 , ω2 ,...,ωn }      原本的n个成分{X1,X2 ,...,Xn}

一个矩阵代表的是一个线性变换规则,而矩阵乘法运算代表的是一个变化。

如果矩阵对某一个向量或某些向量只发生伸缩变换,不对这些向量产生旋转的效果,那么这些向量就称为这个矩阵的特征向量。伸缩的比例就是特征值。

 

 

 

 

 

 

 

 

 

posted @ 2022-10-20 22:50  古路无行客  阅读(44)  评论(0)    收藏  举报