2019年2月11日

代码分析

摘要: 3-1_abnormal_check.py 读入数据,指定索引列,画箱线图,检查数据异常值 3-2_statistics_analyze.py 统计量分析,极差,变异系数,四分位数间距,过滤异常数据 3-3_dish_pareto.py 贡献度分析,画帕累托图 3-4_correlation_ana 阅读全文

posted @ 2019-02-11 14:56 wangzhonghan 阅读(181) 评论(0) 推荐(0)

数据探索--数据质量分析

摘要: 数据质量分析的任务:检查原始数据中的脏数据(缺失值,异常值,不一致的值,重复数据及含有特殊符号(如#,$,*)的数据) 1 缺失值: 缺失值包括:记录的缺失,记录中某个字段信息的缺失 缺失值处理方法:删除缺失值的记录,对可能值插补,不处理 2 异常值: 异常值包括:录入错误,不合常理的数据 异常值处 阅读全文

posted @ 2019-02-11 13:38 wangzhonghan 阅读(154) 评论(0) 推荐(0)

导航