会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
比较大的小仙女
博客园
首页
新随笔
新文章
联系
订阅
管理
2017年8月24日
数据清洗
摘要: 预处理阶段 预处理阶段主要做两件事情: 一是将数据导入处理工具。通常来说,建议使用数据库,单机跑数搭建MySQL环境即可。如果数据量大(千万级以上),可以使用文本文件存储+Python操作的方式。 二是看数据。这里包含两个部分:一是看元数据,包括字段解释、数据来源、代码表等等一切描述数据的信息;二是
阅读全文
posted @ 2017-08-24 17:34 一菲宝宝
阅读(243)
评论(0)
推荐(0)