PCA主成分分析原理随笔
PCA是一种无监督学习的多元统计分析方法,提取多元事物是主要因素揭示其本质特征
D(经过预处理白数据)→SD(对数据进行拉伸)→RSD(对数据进行旋转)→D'
数据拉伸方向为方差变化的最大方向:左乘一个S矩阵     S=
旋转角度为方差最大的角度:在旋转数据后左乘一个R矩阵   R= 
协方差矩阵的特征向量就是R
协方差矩阵C:
1.  λc 特征值:特征值比重为贡献率(整体权重)
2. βc 特征向量:某一新生成的主成分各个属性的权重
F1 =ω1X1 +ω2X2 +...+ωn Xn
βc={ω1 , ω2 ,...,ωn } 原本的n个成分{X1,X2 ,...,Xn}
一个矩阵代表的是一个线性变换规则,而矩阵乘法运算代表的是一个变化。
如果矩阵对某一个向量或某些向量只发生伸缩变换,不对这些向量产生旋转的效果,那么这些向量就称为这个矩阵的特征向量。伸缩的比例就是特征值。
 
                    
                     
                    
                 
                    
                
 
                
            
         
         浙公网安备 33010602011771号
浙公网安备 33010602011771号