摘要:
1、Hive分区(十分重要!!) 在大数据中,最常见的一种思想就是分治,我们可以把大的文件切割划分成一个个的小的文件,这样每次操作一个个小的文件就会很容易了,同样的道理,在hive当中也是支持这种思想的,就是我们可以把大的数据,按照每天或者每小时切分成一个个小的文件,这样去操作小的文件就会容易很多了 阅读全文
posted @ 2023-12-08 19:38
SIKeborn
阅读(116)
评论(0)
推荐(0)
摘要:
1、Hive基本概念 1.1 Hive简介 Hive本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据存储,说白了hive可以理解为一个将SQL转换为MapReduce的任务的工具,甚至更近一步说hive就是一个MapReduce客户端。 思考:计算文件user.txt中 阅读全文
posted @ 2023-12-08 19:26
SIKeborn
阅读(239)
评论(0)
推荐(0)

浙公网安备 33010602011771号