会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
光彩照人
每一次挫折都是一次蜕变,挫折越大,蜕变越彻底!
博客园
首页
新随笔
联系
订阅
管理
2018年7月16日
为什么要进行数据分箱?(转)
摘要: 一般在建立分类模型时,需要对连续变量离散化,特征离散化后,模型会更稳定,降低了模型过拟合的风险。比如在建立申请评分卡模型时用logsitic作为基模型就需要对连续变量进行离散化,离散化通常采用分箱法。 分箱的重要性及其优势 原文链接:https://blog.csdn.net/pylady/arti
阅读全文
posted @ 2018-07-16 11:01 光彩照人
阅读(9378)
评论(2)
推荐(0)
公告