会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
燕麦拿铁
人生会遇到好的事情,也会遇到不好的事情,这就是人生
博客园
首页
新随笔
联系
订阅
管理
随笔分类 -
数据预处理
数据清洗 - 缺失值
摘要:1. 数据缺失分类 行记录的缺失,又称数据记录丢失 列值的缺失,即数据记录中某些列(变量)的值空缺 2. 数据列缺失的处理思路 2.1 丢弃 缺失值所在的行或者列整体删除,减少缺失数据对总体的影响 整行删除的前提:缺失行占总体的比例非常低,一般在5%以内 整列删除(对应变量删除)的前提:缺失值占整列
阅读全文
posted @
2020-04-21 22:00
燕麦拿铁
阅读(1660)
评论(0)
推荐(0)
数据预处理 - 先导篇
摘要:1. 数据预处理的作用 数据分析过程中的重要环节 直接决定了后期所有数据工作的质量和价值输出 对建立模型的最终结果起到决定性的作用 2. 数据预处理的主要内容 数据清洗 数据转换 数据降维 样本不均衡 数据抽样 共线性问题 相关性 标准化 离散化 非结构化数据
阅读全文
posted @
2020-04-21 18:02
燕麦拿铁
阅读(241)
评论(0)
推荐(0)
公告