hdfs的原理初看

1.角色：namenode、datanode、secondarynamenode、hadoop-client

2.作用：namenode:管理元数据；接受hadoop-client的操作命令；

datanode：存储文件block；定期向namenode发送block信息；

secondarynamenode:checkpoint

hadoop-client：操作hdfs；

3.举例：对hdfs的put、get；

put：1、hadoop-client 《--》namenode（检查目录是否存在）；

　　 2、hadoop-client对文件分块，block_1以及副本 --》 namenode

　　 3、namenode从datanodepool中找到相应的datanode -- 》 hadoop-client

4、hadoop-client --》 datanode发送建立pipeline的请求

　　 5、datanode建立pipeline

6、hadoop-client--》datanode建立socket连接并发送block_1

get：1、hadoop-client --》namenode

　　 2、namenode检查目录，存在就返回文件名+副本数+block块以及所在datanodeid

　　 3、hadoop-client --》datanode取block

4.checkpoint：secondarynamenode获取namenode的image和edits，将merge好的返回给namenode，便于冷启动。

posted @ 2017-04-03 12:17 入门到精通—从一而终阅读(89) 评论(0) 收藏举报

刷新页面返回顶部

毛梦