随笔分类 - 机器学习scikit
许多写在jupyter中,后期会转入
摘要:(1)K折交叉验证(KFold):通常K选取值为3、5、10 当不能确定使用何种验证方法时,可采用K折验证法; 当不知确定K的取值时,最优的情况是选10。 (2)分离训练数据集合评估数据集(train_test_split) 执行效率非常高,可以有效的解决某些算法执行速度慢的问题,也可以解决数据量大
阅读全文
摘要:1、VarianceThreshold() 删除方差低的要素 是一种简单的特征选择基线方法。它会删除方差不符合某个阈值的所有要素。默认情况下,它会删除所有零方差要素,即在所有样本中具有相同值的要素。 2、单变量特征选择 (1)SelectKBest()删除除了k个最高得分外的所有特征 对于回归:f_
阅读全文

浙公网安备 33010602011771号