mglearn 完美演示主成分分析(PCA)
主成分分析(PCA)是一种旋转数据集的方法,旋转后特征在统计意义上不相关。
用二维模拟数据集展示如下:
import mglearn import matplotlib.pyplot as plt mglearn.plots.plot_pca_illustration() plt.show()
按语 :
第 1 张图,找到方差最大的方向记为“第一主成分”;第 2 张图,从数据中减去平均值后进行旋转;第 3 张图,保留第一主成分进行降维:第 4 张图,反向旋转并添加平均值到数据中,使得仅保留第一主成分的数据点位于原始的数据空间中。
非学无以广才,非志无以成学。