会员
众包
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
?demon
导航
博客园
首页
新随笔
联系
订阅
管理
公告
2020年2月2日
寒假学习(四)编写MapReduce程序清洗信件内容数据
摘要: 对爬取到的数据进行清洗,按照一定的规则把“脏数据”“洗掉”。 数据清洗是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。 import java.io.BufferedReader; import java.io.InputStreamReader; impo
阅读全文
posted @ 2020-02-02 19:51 <demon>
阅读(515)
评论(0)
推荐(0)
编辑