摘要:
(一)、桶的概念: 对于每一个表(table)或者分区, Hive可以进一步组织成桶(没有分区能分桶吗?),也就是说桶是更为细粒度的数据范围划分。Hive也是 针对某一列进行桶的组织。Hive采用对列值哈希,然后除以桶的个数求余的方式决定该条记录存放在哪个桶当中。 把表(或者分区)组织成桶(Buck 阅读全文
posted @ 2017-05-01 20:49
随学随写
阅读(1541)
评论(0)
推荐(0)
摘要:
一、Hive分区(一)、分区概念:为什么要创建分区:单个表数据量越来越大的时候,在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。(1)、Hive的分区和mysql的分区差异:mysql分区 阅读全文
posted @ 2017-05-01 20:12
随学随写
阅读(2235)
评论(0)
推荐(0)
浙公网安备 33010602011771号