摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 特征选择就是从数据的所有特征中选择部分的特征作为训练集,从而降低数据维度,提高机器学习性能。 2、PCA 主成分分析是一种分析、简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。 二、并用自己的话阐述出两者 阅读全文
posted @ 2020-04-28 17:32 Fzwei博客 阅读(138) 评论(0) 推荐(0)
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 源代码: from sklearn. 阅读全文
posted @ 2020-04-28 17:18 Fzwei博客 阅读(114) 评论(0) 推荐(0)
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 防止过拟合: L1正则,通过增大正则项导致更多参数为0,参数系数化降低模型复杂度,从而抵抗过拟合。 L2正则,通过使得参数都趋于0,变得很小,降低模型的抖动,从而抵抗过拟合。 加大样本量。 通过特征选择减少特征量。 阅读全文
posted @ 2020-04-28 10:54 Fzwei博客 阅读(159) 评论(0) 推荐(0)