摘要:
一:分区表 Hive中的表对应HDFS上的指定目录,在查询数据的时候,默认会对全表进行扫描,这样的话时间和性能消耗都非常大 分区对应HDFS上表目录的子目录 数据按照分区存在在子目录中,如果查询的 where 字句的中包含分区条件,则直接从该分区去查找,而不是扫描整个表目录,合理的分区设计可以极大提 阅读全文
posted @ 2020-12-24 15:38
Ailin1017
阅读(303)
评论(0)
推荐(0)
摘要:
一:Hive DDL 1. 数据库的基本操作 1.1 查看数据库列表 show databases; 1.2 使用数据库 use databse_name; 1.3 新建数据库 CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name --DATA 阅读全文
posted @ 2020-12-24 15:08
Ailin1017
阅读(357)
评论(0)
推荐(0)
摘要:
一:Hive简介 Hive是构建在hadoop上的数据仓库,可以把结构化的数据文件映射成表,并提供SQL查询功能,用于查询的SQL语句会被转成MapReduce 任务提交到hadoop上运行。 Hive出现的原因? 面对海量数据的分析hadoop是个好东西,但是学习成本比较高,难度大,需要使用人员得 阅读全文
posted @ 2020-12-24 14:12
Ailin1017
阅读(131)
评论(0)
推荐(0)

浙公网安备 33010602011771号