什么是主成分分析(PCA)
- 定义:
- 高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量
- 作用:
- 是数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量信息。
- 应用:
API
sklearn.decomposition.PCA(n_components=None)
- 将数据分解为较低维数空间
n_components:
- 小数:表示保留百分之多少的信息
- 整数:减少到多少特征
PCA.fit_transform(X) X:numpy array格式的数据[n_samples,n_features]- 返回值:转换后指定维度的
array
from sklearn.decomposition import PCA
def pca(data):
transfer = PCA(n_components=2)
data_final = transfer.fit_transform(data)
print('返回结果为:', data_final)
if __name__ == '__main__':
data = [
[2, 8, 4, 5],
[6, 3, 0, 8],
[5, 4, 9, 1]
]
pca(data)
'''
返回结果为: [[ 1.28620952e-15 3.82970843e+00]
[ 5.74456265e+00 -1.91485422e+00]
[-5.74456265e+00 -1.91485422e+00]]
'''