文章分类 -  【SQL】Hive(HQL)

Apache Hive‌是一个开源的数据仓库系统,而不是数据库管理系统‌。Hive本身并不是一个数据库,而是一个数据仓库基础设施。Hive建立在Hadoop之上,用于查询和分析主要存储在Hadoop文件中的大型数据集。它提供了一种类似于SQL的查询语言,称为HiveQL,可将SQL转换成MR。Hive使用Hadoop的HDFS作为底层存储系统,并使用Hive Metastore存储元数据,来跟踪表、分区、列和其他元数据信息。Hive Metastore通常使用关系型数据库(例如MySQL或Derby)作为其存储后端。
摘要:【HQL】DQL (三) 分桶和抽样查询 1、分桶表数据存储 首先需要创建分桶表: create table stu_buck1(id int, name string) clustered by (id) into 4 buckets row format delimited fields ter 阅读全文

posted @ 2021-08-24 16:23 MissRong 阅读(300) 评论(0) 推荐(0) |

博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3