一、用自己的话描述出其本身的含义:
1、特征选择
2、PCA
特征选择:是指从已有的M个特征中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,
PCA:是一种分析、简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。
二、并用自己的话阐述出两者的主要区别
特征选择是特征较少时使用,PAC是特征有上百个的时候使用,
特征选择部分特征的相关度高,容易消耗计算性能
PAC是数据维数压缩,尽可能尽可能降低原数据的维数(复杂度),损失少量信息。