2020年4月27日

摘要: 一、用自己的话描述出其本身的含义: 1、特征选择:从m个原始特征中选择n个最有效特征以降低数据集维度的过程来使得系统的特定指标最优化。 2、PCA:数据中会使方差最大化的方向,它是在对特征数据执行投影或压缩时,最大化的降低信息丢失。 二、并用自己的话阐述出两者的主要区别 PCA降维是从选择最优基向量 阅读全文
posted @ 2020-04-27 19:25 Le、 阅读(108) 评论(0) 推荐(0) 编辑
 
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 #导入 from sklearn.f 阅读全文
posted @ 2020-04-27 12:05 Le、 阅读(130) 评论(0) 推荐(0) 编辑
 
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 1)随着模型训练的进行,模型的复杂度会增加,此时模型在训练数据集上的训练误差会逐渐减小,但是在模型的复杂度达到一定程度时,模型在验证集上的误差反而随着模型的复杂度增加而增大。此时便发生了过拟合,即模型的复杂度升高, 阅读全文
posted @ 2020-04-27 11:44 Le、 阅读(201) 评论(0) 推荐(0) 编辑