10 2017 档案

摘要:Hive索引入门 阅读全文
posted @ 2017-10-17 16:18 fee先生 阅读(959) 评论(0) 推荐(0)
摘要:1、基本概念 (1)桶表是对某一列数据进行哈希取值以将数据打散,然后放到不同文件中存储。 (2)在hive分区表中,分区中的数据量过于庞大时,建议使用桶。 (3)在分桶时,对指定字段的值进行hash运算得到hash值,并使用hash值除以桶的个数做取余运算得到的值进行分桶,保证每个桶中有数据但每个桶 阅读全文
posted @ 2017-10-10 17:12 fee先生 阅读(4507) 评论(0) 推荐(0)