hdfs的原理初看
1.角色:namenode、datanode、secondarynamenode、hadoop-client
2.作用:namenode:管理元数据;接受hadoop-client的操作命令;
datanode:存储文件block;定期向namenode发送block信息;
secondarynamenode:checkpoint
hadoop-client:操作hdfs;
3.举例:对hdfs的put、get;
put:1、hadoop-client 《--》namenode(检查目录是否存在);
2、hadoop-client对文件分块,block_1以及副本 --》 namenode
3、namenode从datanodepool中找到相应的datanode -- 》 hadoop-client
4、hadoop-client --》 datanode发送建立pipeline的请求
5、datanode建立pipeline
6、hadoop-client--》datanode建立socket连接并发送block_1
get:1、hadoop-client --》namenode
2、namenode检查目录,存在就返回文件名+副本数+block块以及所在datanodeid
3、hadoop-client --》datanode取block
4.checkpoint:secondarynamenode获取namenode的image和edits,将merge好的返回给namenode,便于冷启动。

浙公网安备 33010602011771号