摘要: 数据统计 作为一个数据科学家,数据统计不要求很精通,但是掌握数据统计的基本知识,能够运用数据统计的相关方法解决实际问题是必要的。从数据的分析的目的和思考方式来看,数据统计方法分为:描述统计和推断统计。从数据分析的方法论角度看,可分为两个层次:基本分析法和元分析法。 1概率分布 在统计学中,概率分布可 阅读全文
posted @ 2017-12-24 10:43 疯狂的蜗牛仔 阅读(465) 评论(0) 推荐(0) 编辑
摘要: 数据预处理 1数据质量 基本属性:正确性,完整性,一致性 2数据审计 运用一定的规律和评价方法,发现数据中存在的问题。如:缺失值,噪声值,不一致值,不完整值。 数据审计的三种类型:预定义审计,自定义审计,可视化审计 3数据清洗 3.1缺失数据清洗 三个活动:缺失识别,缺失分析,缺失处理 方法:较为简 阅读全文
posted @ 2017-12-24 10:35 疯狂的蜗牛仔 阅读(376) 评论(0) 推荐(0) 编辑