会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
雪原那么远
2020年2月25日
【ML】数据清洗
摘要: 之前听别人说,一个好的数据分析师80%的时间都花在数据清洗上,一个高质量的数据集才能支撑的了接下来的数据分析和应用。 什么是好的数据质量呢,我认为只要满足俩个方面就可以了: 1.完整:比如说 缺值少值,值不完整,NAN之类 2.合法:数据的类型,内容,大小是符合该特征的。比如,一个年龄的特征值不可能
阅读全文
posted @ 2020-02-25 20:39 雪原那么远
阅读(312)
评论(0)
推荐(0)
导航
博客园
首页
新随笔
联系
订阅
管理
公告