摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 1.特征选择是从给定的特征集合中选出相关特征使得系统特定指标最优化的过程,作用在于降低数据集维度,从而获得分类错误概率小的分类特征。 2.PCA 主要用于数据降维,利用现有特征构建新的特征,使它们反映事物的主要特征,压缩原有数据矩阵的规模 阅读全文
posted @ 2020-04-29 12:02 fourn666 阅读(144) 评论(0) 推荐(0)
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 from sklearn.featu 阅读全文
posted @ 2020-04-29 11:34 fourn666 阅读(117) 评论(0) 推荐(0)
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) (1)增加样本量,这是万能的方法,适用任何模型; 如果数据稀疏,使用L1正则,其他情况,用L2要好,可自己尝试; 通过特征选择,剔除一些不重要的特征,从而降低模型复杂度; 如果还过拟合,那就看看是否使用了过度复杂的 阅读全文
posted @ 2020-04-29 11:26 fourn666 阅读(170) 评论(0) 推荐(0)