HIve QL 执行计划

1、官网

(1)LanguageManual Explain - Apache Hive - Apache Software Foundation

 

2、为什么是Stage-3

(1)在join使用的过程中,本地浏览器的运行终端FINISHED Applications中显示的是select e.empno,e.ename,e...e.deptno=d.deptno (Stage-3)

(2)简化的运行信息

hive (testzhang_db)> explain
                   > select
                   > e.empno,e.ename,e.sal,e.deptno,d.dname
                   > from emp e join dept d
                   > on e.deptno=d.deptno;

(3)详细的运行信息

hive (testzhang_db)> explain EXTENDED
                   > select
                   > e.empno,e.ename,e.sal,e.deptno,d.dname
                   > from emp e join dept d
                   > on e.deptno=d.deptno;

 

3、一个执行计划包含三个层面

(1)SQL的抽象语法树

(2)不同stage之间的依赖关系

(3)每个stage的描述

 

4、作业

生产上的Hive是高可用的,谈谈你对Hive高可用架构实现的看法及实现

提示:
1) Hive的高可用关键点是元数据的高可用
2) 元数据高可用如何实现
3) 元数据如何进行备份和迁移

 

posted @ 2021-08-30 14:44  酱汁怪兽  阅读(50)  评论(0)    收藏  举报