特征降维之主成分分析

特征降维之主成分分析

什么是主成分分析(PCA)

  • 定义:
    • 高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量
  • 作用:
    • 是数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量信息。
  • 应用:
    • 回归分析或者聚类分析当中

API

  • sklearn.decomposition.PCA(n_components=None)
    • 将数据分解为较低维数空间
    • n_components:
      • 小数:表示保留百分之多少的信息
      • 整数:减少到多少特征
    • PCA.fit_transform(X) X:numpy array格式的数据[n_samples,n_features]
    • 返回值:转换后指定维度的array
from sklearn.decomposition import PCA

def pca(data):
    # 示例化一个转化器类
    transfer = PCA(n_components=2)
    # 调用 transfer.fit_transform
    data_final = transfer.fit_transform(data)
    print('返回结果为:', data_final)
    # 输出特征名字
    # print('特征名字为:', transfer.get_feature_names())


if __name__ == '__main__':
    data = [
        [2, 8, 4, 5],
        [6, 3, 0, 8],
        [5, 4, 9, 1]
    ]
    pca(data)
    
    '''
    返回结果为: [[ 1.28620952e-15  3.82970843e+00]
     [ 5.74456265e+00 -1.91485422e+00]
     [-5.74456265e+00 -1.91485422e+00]]
    '''
posted @ 2020-12-17 15:47  clienter  阅读(88)  评论(0)    收藏  举报