机器学习九----主成分分析


一、用自己的话描述出其本身的含义:

1、特征选择

特征选择就是在进行机器学习的模型训练和预测过程中,在面对大量的特征数据前,去掉无关的特征,实现数据的降维。举个例子,预测某一天出去玩的概率,如果数据中有类似衣服颜色、袜子颜色等无用的数据,就可人工把这些特征数据去掉。这样不仅提高了模型训练的速度,也提高了模型的泛化能力。

 

2、PCA

PCA也是数据降维的一种方式,因为数据降维带着一定的数据损失,PCA主成分分析主要通过将N维的数据映射到K维上,控制数据损失,得到新的数据和降维后的特征维度

 

二、并用自己的话阐述出两者的主要区别

特征选择主要是对数据变化较小,不影响整体数据的拟合和预测的这些特征数据进行处理,而在现实大量的数据特征面前,特征太多,有些特征和另一个特征之间是有关系的,所以PCA主成分分析主要是通过算法,找出之间的关系,减少降维后的数据损失,达到降维的目的。

posted on 2020-05-04 15:34  xiaoAP  阅读(164)  评论(0编辑  收藏  举报

导航