会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
闪电战
博客园
首页
新随笔
联系
订阅
管理
2015年5月6日
Hive过滤脏数据的一些经验
摘要: 如下文件需要处理,每个文件大概13G,其中字段以空格(32)分隔的7个字段;最麻烦的是中间有脏数据:-rw-r--r-- 1 hadoop ifengdev 1895843464 May 6 14:56 feedback201503_201.tar.gz-rw-r--r-- 1 hadoop if...
阅读全文
posted @ 2015-05-06 17:39 闪电战
阅读(3730)
评论(0)
推荐(0)