摘要:
Combiner用来在map输出之前先做一次合并,减少map和reduce节点之间的数据传输,优化mapreduce。 Combiner相当于是一个小的reduce,如下所示 map:(key1,value1) ——> list(key2,value2) combiner:(key2,list(va 阅读全文
posted @ 2016-06-11 15:35
草莓干123456
阅读(187)
评论(0)
推荐(0)
摘要:
1、分区 在hive中使用select查询一般会扫描整个表的内容,从而降低降低查询的效率。引入分区的概念,使得查询时只扫描表中关心的部分数据。 一个表中可以有一个或多个分区,每个分区以文件夹的形式单独存在表文件夹的目录下。 1.1分区建表分为单分区和双分区建表: 单分区建表语句:create tab 阅读全文
posted @ 2016-06-11 15:23
草莓干123456
阅读(3390)
评论(0)
推荐(0)

浙公网安备 33010602011771号