随笔分类 -  python数据分析

摘要:数据质量分析 脏数据包括:缺失值;异常值;不一致的值;重复数据及含有特殊符号的数据; 1.缺失值处理 统计缺失率,缺失数 2.异常值处理 (1)简单统计量分析 (2)3Q原则 正态分布情况下,小概率事件为异常值 不服从正太分布的,可以用原离平均值多少倍标准差来分析 (3)箱线图分析 使用descri 阅读全文
posted @ 2018-04-19 14:06 冷幽篁 阅读(931) 评论(0) 推荐(0)
摘要:第一次完整的完成天池的新人赛,以激励自己后续进一步的学习 阅读全文
posted @ 2018-02-01 14:08 冷幽篁 阅读(3522) 评论(1) 推荐(0)