大数据作业二

1. (单选题, 2分)分布式文件系统指的是什么?

  • A. 把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
  • B.用于在Hadoop与传统数据库之间进行数据传递
  • C. 一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统
  • D. 一种高吞吐量的分布式发布订阅消息系统,可以处理消费者规模的网站中的所有动作流数据

A

2. (单选题, 2分)下面哪一项不属于计算机集群中的节点?

  • A.主节点(Master Node)
  • B. 从节点(Slave Node)
  • C.源节点(SourceNode)
  • D.名称结点(NameNode)

C

3. (单选题, 2分)在HDFS中,默认一个块多大?

  • A.16KB
  • B. 32KB
  • C. 128KB
  • D. 64MB

D

4. (单选题, 2分)下列哪一项不属于HDFS采用抽象的块概念带来的好处?

  • A.简化系统设计
  • B.支持大规模文件存储
  • C.强大的跨平台兼容性
  • D.适合数据备份

C

5. (单选题, 2分)在HDFS中,NameNode的主要功能是什么?

  • A.维护了block id 到datanode本地文件的映射关系
  • B.存储文件内容
  • C.文件内存保存在磁盘中
  • D.存储元数据

D

6. (单选题, 2分)下面对FsImage的描述,哪个是错误的?

  • A. FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据
  • B. FsImage文件包含文件系统中所有目录和文件inode的序列化形式
  • C.FsImage文件记录了每个块具体被存储在哪个数据节点 
  • D.FsImage文件没有记录每个块存储在哪个数据节点

C

7. (单选题, 2分)下面对SecondaryNameNode第二名称节点的描述,哪个是错误的?

  • A. SecondaryNameNode通过HTTPGET方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下
  • B. 它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
  • C.SecondaryNameNode一般是并行运行在多台机器上 
  • D. SecondaryNameNode是HDFS架构中的一个组成部分

C

8. (单选题, 2分)HDFS采用了什么模型?

  • A. 分层模型
  • B.主从结构模型
  • C.管道-过滤器模型
  • D. 点对点模型

B

9. (单选题, 2分)在Hadoop项目结构中,HDFS指的是什么?

  • A. Hadoop上的数据仓库
  • B.资源管理和调度器
  • C. 流数据读写
  • D. 分布式文件系统

D

10. (单选题, 2分)下列关于HDFS的描述,哪个不正确?

  • A. HDFS采用块的概念,使得系统的设计变得更加复杂
  • B.  HDFS采用了主从(Master/Slave)结构模型
  • C. HDFS采用了冗余数据存储,增强了数据可靠性
  • D.  HDFS还采用了相应的数据存放、数据读取和数据复制策略,来提升系统整体读写响应性能

A

11. (多选题, 2分)HDFS要实现以下哪几个目标?

  • A.复杂的文件模型
  • B. 兼容廉价的硬件设备
  • C.大数据集
  • D.流数据读写

BCD

12. (多选题, 2分)HDFS特殊的设计,在实现优良特性的同时,也使得自身具有一些应用局限性,主要包括以下哪几个方面?

  • A.无法高效存储大量小文件
  • B.较差的跨平台兼容性
  • C.不支持多用户写入及任意修改文件
  • D.不适合低延迟数据访问

ACD

13. (多选题, 2分)HDFS采用抽象的块概念可以带来以下哪几个明显的好处?

  • A. 支持大规模文件存储
  • B.适合数据备份
  • C.支持小规模文件存储
  • D. 简化系统设计 

ABD

14. (多选题, 2分)在HDFS中,名称节点(NameNode)主要保存了哪些核心的数据结构?

  • A.DN8
  • B.Block
  • C. FsImage
  • D.EditLog

CD

15. (多选题, 2分)数据节点(DataNode)的主要功能包括哪些?

  • A.负责数据的存储和读取
  • B. 根据客户端或者是名称节点的调度来进行数据的存储和检索
  • C.向名称节点定期发送自己所存储的块的列表
  • D.用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间

ABC

16. (多选题, 2分)HDFS的命名空间包含什么?

  • A.文件
  • B.块
  • C.磁盘
  • D.目录

ABD

17. (多选题, 2分)下列对于客服端的描述,哪些是正确的?

  • A. 客户端是用户操作HDFS最常用的方式,HDFS在部署时都提供了客户端
  • B.HDFS客户端是一个库,暴露了HDFS文件系统接口
  • C. 严格来说,客户端并不算是HDFS的一部分
  • D.客户端可以支持打开、读取、写入等常见的操作

ABCD

18. (多选题, 2分)HDFS只设置唯一一个名称节点,这样做虽然大大简化了系统设计,但也带来了哪些明显的局限性?

  • A.命名空间的限制
  • B. 性能的瓶颈
  • C.隔离问题
  • D.集群的可用性

ABCD

19. (多选题, 2分)HDFS数据块多副本存储具备以下哪些优点?

  • A.加快数据传输速度
  • B. 适合多平台上运行
  • C.  容易检查数据错误
  • D.保证数据可靠性

ACD

20. (多选题, 2分)HDFS具有较高的容错性,设计了哪些相应的机制检测数据错误和进行自动恢复?

  • A.数据节点出错
  • B. 数据出错
  • C. 名称节点出错
  • D.数据源太大 

ABC

posted @ 2023-12-15 19:44  霍普金斯大学丁真  阅读(25)  评论(0)    收藏  举报