2017年4月25日
摘要: 原因:数据质量,完整性、一致性、准确性 数据清理: 补全缺失数据、光滑噪声数据、识别并提出离散点 缺失值 噪声数据 分箱 回归拟合 分箱 回归拟合 数据集成: 合并多个数据存储的数据 实体识别问题(不同名称,数值可能是相同的内容) 冗余与相关性分析 卡方检验 相关系数 协方差 卡方检验 相关系数 协 阅读全文
posted @ 2017-04-25 20:56 BitInterfc 阅读(93) 评论(0) 推荐(0)