会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
enmink
博客园
首页
新随笔
联系
管理
订阅
03 2019 档案
数据挖掘中数据清洗的方法
摘要:数据清洗一是为了解决数据质量问题,二是让数据更加适合做挖掘 一、解决数据质量问题 数据的完整性,比如人的属性中缺少性别、籍贯、年龄等 数据的唯一性,比如不同来源的数据出现重复的情况 数据的权威性,比如同一个指标出现多个来源的数据,且数值不一样 数据的合法性,比如数据与常识不符,市区内开车速度到达了4
阅读全文
posted @
2019-03-24 00:39
enmink
阅读(15560)
评论(0)
推荐(0)
数据清洗
摘要:数据清洗
阅读全文
posted @
2019-03-24 00:23
enmink
阅读(730)
评论(0)
推荐(0)
公告