作业九
一、用自己的话描述出其本身的含义:
1、特征选择
通过特征选取删选掉冗余和不相关的特征来进一步降维的特征。
2、PCA:是一种分析、简化数据集的技术。可以尽可能降低原数据的维度 (复杂度),损失少量信息。
二、并用自己的话阐述出两者的主要区别
特征选择主要用于特征较少时使用,而主成份分析的特征可达上百个。特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,
假设原始特征中有个特征的值是9,那么特征选择选到这个特征后它的值还是9,并没有改变。降维本质上是从一个维度空间映射到另一个
维度空间,假设原始特征中有个特征的值是9,那么降维后对应的值可能是3。
浙公网安备 33010602011771号