2018年10月9日

决策树算法

摘要: 决策树 决策树:从根节点开始一步步走到叶子节点(决策) 所有的数据最终都会落到叶子节点,既可以做分类也可以做回归 增加节点相当于在数据上切一刀: C4.5解决ID3存在的拆分后叶子节点过多,且叶子集合较为稀疏问题。 阅读全文

posted @ 2018-10-09 16:25 布衣小工 阅读(140) 评论(0) 推荐(0) 编辑

特征工程实践总结

摘要: 1.样本不平衡性 常见处理方法: 过采样(正负样本一样多):增加正样本个数 方法:通常通过SMOTE进行样本生成 特点:召回率略低,但误杀率也低 下采样(正负样本一样少):减少负样本个数 方法:原数据要拆分为train_set1和test_set1,针对整个数据集下采样后数据也要拆分为train_s 阅读全文

posted @ 2018-10-09 14:23 布衣小工 阅读(386) 评论(0) 推荐(0) 编辑

导航