mglearn 完美演示主成分分析(PCA)

主成分分析(PCA)是一种旋转数据集的方法,旋转后特征在统计意义上不相关。

用二维模拟数据集展示如下:

import mglearn
import matplotlib.pyplot as plt

mglearn.plots.plot_pca_illustration()

plt.show()

 按语 :

   第 1 张图,找到方差最大的方向记为“第一主成分”;第 2 张图,从数据中减去平均值后进行旋转;第 3 张图,保留第一主成分进行降维:第 4 张图,反向旋转并添加平均值到数据中,使得仅保留第一主成分的数据点位于原始的数据空间中。

posted @ 2019-11-20 23:16  赏尔  阅读(896)  评论(0)    收藏  举报