摘要:
来自:http://blog.csdn.net/dandingyy/article/details/7490046众所周知,Hadoop对处理单个大文件比处理多个小文件更有效率,另外单个文件也非常占用HDFS的存储空间。所以往往要将其合并起来。1,getmergehadoop有一个命令行工具getm... 阅读全文
posted @ 2014-09-12 16:28
悟寰轩-叶秋
阅读(730)
评论(0)
推荐(0)
摘要:
http://grepalex.com/2013/05/20/multipleoutputs-part1/http://grepalex.com/2013/07/16/multipleoutputs-part2/ 阅读全文
posted @ 2014-09-12 11:11
悟寰轩-叶秋
阅读(184)
评论(0)
推荐(0)

浙公网安备 33010602011771号