摘要: 数据预处理背景 大数据项目开发流程 数据质量 准确性:数据是正确的,数据存储在数据库中的值对应于真实世界的值。 数据不准确的原因 1. 数据收集设备故障。 2. 数据输入错误。 3. 数据传输过程出错。 4. 命名约定、数据输入、输入字段格式不一致。 相关性:指数据与特定的应用和领域有关。 相关性应 阅读全文
posted @ 2020-04-16 17:27 程序员李林 阅读(1780) 评论(0) 推荐(0)