会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
程序员李林
博客园
首页
新随笔
联系
订阅
管理
2020年4月16日
大数据预处理综述
摘要: 数据预处理背景 大数据项目开发流程 数据质量 准确性:数据是正确的,数据存储在数据库中的值对应于真实世界的值。 数据不准确的原因 1. 数据收集设备故障。 2. 数据输入错误。 3. 数据传输过程出错。 4. 命名约定、数据输入、输入字段格式不一致。 相关性:指数据与特定的应用和领域有关。 相关性应
阅读全文
posted @ 2020-04-16 17:27 程序员李林
阅读(1780)
评论(0)
推荐(0)
公告