HDFS 架构图


HDFS架构图

HDFS 服务功能


NameNode

NameNode是主节点,存储文件的元数据如文件名,文件目录,文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。

DataNode

DataNode在本地文件系统存储文件块数据,以及块数据的校验和。

Secondary NameNode

Secondary NameNode用来监控HDFS状态的辅助后台程序,每隔一段时间获取HDFS元数据的快照。

YARN 架构图


YARN架构图

YARN 服务功能


ResourceManager
  • 处理客户端请求;
  • 启动/监控ApplicationMaster;
  • 监控NodeManager;
  • 资源分配与调度
ApplicationMaster
  • 数据切分;
  • 为应用程序申请资源,并分配给内部任务;
  • 任务监控与容错
NodeManager
  • 单个节点上的资源管理;
  • 处理来自ResourceManager的命令;
  • 处理来自ApplicationMaster的命令
Container
  • 对任务运行环境的抽象,封装了CPU、内存等多维资源以及环境变量、启动命令等任务运行相关的信息