hdfs的原理初看

1.角色:namenode、datanode、secondarynamenode、hadoop-client

2.作用:namenode:管理元数据;接受hadoop-client的操作命令;

datanode:存储文件block;定期向namenode发送block信息;

secondarynamenode:checkpoint

hadoop-client:操作hdfs;

3.举例:对hdfs的put、get;

put:1、hadoop-client 《--》namenode(检查目录是否存在);

    2、hadoop-client对文件分块,block_1以及副本 --》 namenode

    3、namenode从datanodepool中找到相应的datanode -- 》 hadoop-client

        4、hadoop-client --》 datanode发送建立pipeline的请求

    5、datanode建立pipeline

        6、hadoop-client--》datanode建立socket连接并发送block_1

get:1、hadoop-client --》namenode

    2、namenode检查目录,存在就返回文件名+副本数+block块以及所在datanodeid

    3、hadoop-client --》datanode取block

4.checkpoint:secondarynamenode获取namenode的image和edits,将merge好的返回给namenode,便于冷启动。

posted @ 2017-04-03 12:17  入门到精通—从一而终  阅读(87)  评论(0)    收藏  举报