随笔分类 -  机器学习scikit

许多写在jupyter中,后期会转入
摘要:(1)K折交叉验证(KFold):通常K选取值为3、5、10 当不能确定使用何种验证方法时,可采用K折验证法; 当不知确定K的取值时,最优的情况是选10。 (2)分离训练数据集合评估数据集(train_test_split) 执行效率非常高,可以有效的解决某些算法执行速度慢的问题,也可以解决数据量大 阅读全文
posted @ 2019-09-08 13:04 大脸猫12581 阅读(673) 评论(0) 推荐(0)
摘要:1、VarianceThreshold() 删除方差低的要素 是一种简单的特征选择基线方法。它会删除方差不符合某个阈值的所有要素。默认情况下,它会删除所有零方差要素,即在所有样本中具有相同值的要素。 2、单变量特征选择 (1)SelectKBest()删除除了k个最高得分外的所有特征 对于回归:f_ 阅读全文
posted @ 2019-09-07 17:37 大脸猫12581 阅读(316) 评论(0) 推荐(0)