摘要: 题记: 近期在做某个大型银行的大数据项目,当在处理非结构化数据时,却发现他们给的数据并不符合hive和pig的处理要求,数据每行必须需要多个分割符才能完美处理,一下午也没有想到完美的办法解决,今天重新审视了一下整个过程。看来hive的命令行没法搞定了。于是乎,只能通过代码来搞定。1、重新实现hiv... 阅读全文
posted @ 2015-09-19 00:15 旧收音机 阅读(4708) 评论(0) 推荐(1)