一、用自己的话描述出其本身的含义:

1、特征选择:

       特征选择是指从已有的很多个特征中只选择几个特征,使得系统的特定指标可以最优化,是从原始特征中选择出一些最有效特征,以降低数据集维度的过程,是提高学习算法性能的一个重要手段。

2、PCA:

        PCA是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。PCA经常用于减少数据集的维数,并且保持数据集的对方差贡献最大的特征。

 

二、并用自己的话阐述出两者的主要区别

       1、特征选择是从已经存在的特征中,选取携带信息最多的,选完之后的特征依然具有可解释性,我们仍然能知道特征在源数据的哪个位置,代表数据的含义是什么。而PCA是将已经存在的特征进行压缩,降维完成后的特征不再是源数据中的任何一个特征,而是通过某种方式组合起来的特征,新的特征矩阵不再具有可读性,属于特征创造的一种。

       2、PCA不适合用于探索特征和标签的关系的模型比如线性回归,因为无法解释新特征与标签的关系,所以在线性回归中用特征选择。

posted on 2020-04-28 09:49  符秋雨  阅读(137)  评论(0编辑  收藏  举报