2020年2月25日

【ML】数据清洗

摘要: 之前听别人说,一个好的数据分析师80%的时间都花在数据清洗上,一个高质量的数据集才能支撑的了接下来的数据分析和应用。 什么是好的数据质量呢,我认为只要满足俩个方面就可以了: 1.完整:比如说 缺值少值,值不完整,NAN之类 2.合法:数据的类型,内容,大小是符合该特征的。比如,一个年龄的特征值不可能 阅读全文

posted @ 2020-02-25 20:39 雪原那么远 阅读(312) 评论(0) 推荐(0)

导航