天下之事,必先处之难,而后易之。

Hadoop发展历程及重要核心模块解读

本文内容及截图来自网络课堂。

目录

Hadoop 四大模块演变

Hadoop HDFS

Hadoop MapReduce

Hadoop YARN


Hadoop 四大模块演变

说明:

版本特点:

 

Hadoop HDFS

HDFS:Hadoop Distributed File System——分布式文件系统

文件系统: 文件+存储block块。

a.单机文件系统:

windows:FAT16,FAT32,NTFS

linux:ext2/3/4,VFS

b. 分布式文件系统

多个服务器存储 文件系统

c.三大组件

  • Namenode:

I.元数据:文件名、目录名、属性(生成时间、权限、副本)

II.文件名与block列表映射关系

III.block与Datanode列表映射关系

  •  DataNode:

block块数据、校验和编码

  • SecondaryNamenode

分担Namenode压力,合并编辑日志edits和镜像文件fsimage(因为合并操作需要占用很 大的系统资源,影响客户端使用。),合并后将最终的镜像文件 fsimage返回给Namenode处理。

 

 

Hadoop MapReduce

——分布式计算

 

 

处理流程:

 

Hadoop YARN

——资源调度和任务管理

四大组件:

  • ResourceManager (RM)

  • NodeManager (NM)

  • ApplicationManager(AM)

  • Container

执行流程:

  1. Client连接RM提交作业,RM给Client一个Job Id(包括:AplicationsManager和Resource Scheduler)
  2. RM中的ApplicationsManager 连接一个NM,让NM创建一个 AM客户端作业请求
  3. AM连接RM中ApplicationsManager 申请NodeManger
  4. AM去ResourceScheduler给Client的作业申请资源(CPU、内存、磁盘、网络等)
  5. AM连接NM,发送Client Job 作业程序和申请资源(CPU、内存、磁盘、网络等)
  6. NM启动Container进程运行Job的不同任务
  7. Container进程运行状态实时反馈给AM
  8. AM反馈任务状态信息给RM中的ApplicationsManager
  9. Client端可以连接RM或AM查询JBO的执行情况

注意:NM启动后回去RM上进行注册,会不断发送心跳,说明处于存活状态。

 

 

posted @ 2024-09-16 09:00  boonya  阅读(72)  评论(0)    收藏  举报  来源
我有佳人隔窗而居,今有伊人明月之畔。
轻歌柔情冰壶之浣,涓涓清流梦入云端。
美人如娇温雅悠婉,目遇赏阅适而自欣。
百草层叠疏而有致,此情此思怀彼佳人。
念所思之唯心叩之,踽踽彳亍寤寐思之。
行云如风逝而复归,佳人一去莫知可回?
深闺冷瘦独自徘徊,处处明灯影还如只。
推窗见月疑是归人,阑珊灯火托手思忖。
庐居闲客而好品茗,斟茶徐徐漫漫生烟。

我有佳人在水之畔,瓮载渔舟浣纱归还。
明月相照月色还低,浅近芦苇深深如钿。
庐山秋月如美人衣,画堂春阁香气靡靡。
秋意幽笃残粉摇曳,轻轻如诉画中蝴蝶。
泾水潺潺取尔浇园,暮色黄昏如沐佳人。
青丝撩弄长裙翩翩,彩蝶飞舞执子手腕。
香带丝缕缓缓在肩,柔美体肤寸寸爱怜。
如水之殇美玉成欢,我有佳人清新如兰。
伊人在水我在一边,远远相望不可亵玩。