10.23

作业6 数据仓库Hive
题量: 11 满分: 60 作答时间:10-21 16:00至10-28 12:00
一. 单选题(共5题,15分)

  1. (单选题, 3分) 下面关于Hive的描述错误的是:
    A
    Hive是一个构建在Hadoop之上的数据仓库工具

B
Hive是由Facebook公司开发的

C
Hive在某种程度上可以看作是用户编程接口,其本身并不存储和处理数据

D
Hive定义了简单的类似SQL的查询语言——HiveQL,它与大部分SQL语法无法兼容

  1. (单选题, 3分) 关于Hive和传统关系数据库的对比分析,下面描述错误的是:
    A
    Hive一般依赖于分布式文件系统HDFS,而传统数据库则依赖于本地文件系统

B
传统的关系数据库可以针对多个列构建复杂的索引,Hive不支持索引

C
Hive和传统关系数据库都支持分区

D
传统关系数据库很难实现横向扩展,Hive具有很好的水平扩展性

  1. (单选题, 3分) 以下哪个不是Hive的用户接口模块:
    A
    PMI

B
HWI(Hive Web Interface)

C
JDBC/ODBC

D
Thrift Server

  1. (单选题, 3分) 下列有关Hive和Impala的对比错误的是
    A
    Hive与Impala使用相同的元数据

B
Hive与Impala中对SQL的解释处理比较相似,都是通过词法分析生成执行计划

C
Hive适合于长时间的批处理查询分析,而Impala适合于实时交互式SQL查询

D
Hive在内存不足以存储所有数据时,会使用外存,而Impala也是如此

  1. (单选题, 3分) 下面描述错误的是
    A
    Hive的功能十分强大,可以支持采用SQL方式查询Hadoop平台上的数据

B
在实际应用中,Hive也暴露出不稳定的问题,在极少数情况下,甚至会出现端口不响应或者进程丢失的问题

C
在Hive HA中,在Hadoop集群上构建的数据仓库是由单个Hive实例进行管理的

D
在Hive HA中,客户端的查询请求首先访问HAProxy,由HAProxy对访问请求进行转发

二. 多选题(共5题,15分)
6. (多选题, 3分) 下列说法正确的是:
A
数据仓库Hive不需要借助于HDFS就可以完成数据的存储

B
Impala和Hive、HDFS、HBase等工具可以统一部署在一个Hadoop平台上

C
Hive本身不存储和处理数据,依赖HDFS存储数据,依赖MapReduce处理数据

D
HiveQL语法与传统的SQL语法很相似

  1. (多选题, 3分) 以下哪些是数据仓库的特性:
    A
    面向主题的(Subject Oriented)

B
集成的(Integrated)

C
相对稳定的(Non-Volatile)

D
反映历史变化

  1. (多选题, 3分) Hadoop生态系统中Hive与其他部分的关系的描述正确的是:
    A
    HDFS作为高可靠的底层存储,用来存储Hive的海量数据

B
MapReduce对这些海量数据进行批处理,实现Hive的高性能计算

C
当采用MapRedue作为Hive的执行引擎时,用HiveQL语句编写的处理逻辑,最终都要转化为MapReduce任务来运行

D
HBase与Hive的功能是互补的,它实现了Hive不能提供的功能

  1. (多选题, 3分) Hive主要由哪三个模块组成:
    A
    用户接口模块

B
用户查询模块

C
驱动模块

D
元数据存储模块

  1. (多选题, 3分) 当采用MapReduce作为Hive的执行引擎时,下面描述正确的是:
    A
    当用户向Hive输入一段命令或查询(即HiveQL语句)时,Hive需要与Hadoop交互工作来完成该操作

B
命令或查询首先进入到驱动模块,由驱动模块中的编译器进行解析编译,并由优化器对该操作进行优化计算,然后交给执行器去执行

C
执行器通常的任务是启动一个或多个MapReduce任务,有时也不需要启动MapReduce任务

D
执行器通常的任务一定会包含Map和Reduce操作

posted @ 2024-10-22 16:03  aallofitisst  阅读(62)  评论(0)    收藏  举报