HDFS源码分析:NameNode相关的数据结构

本文主要基于Hadoop1.1.2分析HDFS中的关键数据结构。

1 NameNode

首先从NameNode开始。NameNode的主要数据结构如下:

 

NameNode管理着两张很重要的表:

1)  filename->blocksequence (namespace) 

2)  block->machinelist ("inodes") 

第一张表保存在磁盘上,第二张表在每次NameNode启动的时候重建。这两张表的信息分别保存在FSDirectory和BlocksMap中。

实际上NameNode并没有亲自完成上述两张表的管理工作,而是由FSNamesystem完成绝大部分的文件系统管理工作。NameNode主要负责向外部提供IPC接口以及HTTP服务,外加上一些配置管理工作。Namenode自己主要实现了三个通信接口:

ClientProtocol:和客户端的通信

DatanodeProtocol:和DataNode的通信

NamenodeProtocol:主要和Second NameNode的通信

 

2 FSNamesystem

NameNode将绝大部分工作都交给了FSNamesystem处理,先来看看FSNamesystem的内部主要数据结构:

下面分别简单解释FSNamesystem内部封装的各个对象。

(1)BlocksMap blocksMap

负责block->block's metadata的映射。

具体有三种映射,如下:
block->datanode list
block->INodeFile
datanode->blocks

(2)NetworkTopology clusterMap

保存了DataNode集群的拓扑结构。

(3)CorruptReplicasMap corruptReplicas

字面意思:出错副本映射。用来记录datanode上所有出错的block。CorruptReplicasMap内部主要封装了一个Block到DataNode集合的映射表。Map<Block, Collection<DatanodeDescriptor>>。

(4)NavigableMap<String, DatanodeDescriptor> datanodeMap

暂时没弄懂

(5)

(6)

 

3 BlocksMap 

现在来具体分析BlocksMap的内部结构:

BlocksMap内部最主要的结构就是一个GSet。GSet是一个存储key-value对的Set。可以将BlocksMap看成一个内部封装了一个没有重复存储Block的数组的数据结构。

BlocksMap负责block->block's metadata的映射。

具体有三种映射,如下:
block->datanode list
block->INodeFile
datanode->blocks

 

4 Block

Block表示文件的某个块。Block可以看做HDFS中的原始数据类型,它由一个Long类型的blockId标识。

 

5 BlocksMap.BlockInfo

BlockInfo这个类定义在BlocksMap内部,继承自Block,先看看它的主要内部结构:

BlockInfo保存了块的元数据信息。

  • block->dataNodeList(块所在的物理位置)
  • block->InodeFile(块在文件目录中的逻辑位置)

这里涉及到两个映射关系:

  1. 一方面,由于一个块具体是存储在某些个DataNode中的,所以需要保存Block与DataNode的映射关系。
  2. 另一方面,Block在逻辑上是属于某个文件的,所以得保存该Block与文件(InodeFile)的映射关系。

所以在具体实现上,BlockInfo封装了如下信息来分别保存上述映射关系:

private INodeFile inode;  //保存块所属的文件
private Object[] triplets;  //三元组,数组长度是副本数*3,保存Block与DataNode的映射关系

正是由于采用了三元组这种数据结构,所以实际上三元组还隐藏了第三种映射关系:

  • datanode->blocks

通过一个block可以知道该block所在的DataNode,然后可以查找到该DataNode中存储的所有block。要想理解这句话,得先弄清楚三元组的具体结构。

详解三元组

文件副本的数目称为文件的副本系数。

一个三元组保存了一个Block的副本的相关信息。在HDFS的具体实现上,是用一个数组的三个连续单元(triplets[3i],triplets[3i+1],triplets[3i+2])来表示一个三元组。

为了容错,一个块会有多个副本,在大多数情况下,副本系统是3。HDFS将这些副本放在数组中连续存储起来,因为一个副本用一个三元组表示,所以每个副本占据3个连续的数组单元,所以如果某个块的副本系统为R,则该块的所有副本占据3*R个数组单元。

因为一个块的所有的副本都是采用数组连续存储的,所以可以实现高效的随机访问。比如需要查看某个块的第i(i>=1)个副本的信息,则直接访问triplets[3(i-1)]即可获得指向该副本所在的DatanodeDescriptor引用;直接访问triplets[3(i-1)+1]即可获得指向该副本所在的DataNode中Block列表中的上一个Block的引用;直接访问triplets[3(i-1)+2]即可获得指向该副本所在的DataNode中Block列表中的下一个Block的引用。这是因为对于每个副本的三元组:

  • triplets[3i]:指向该副本所在的DatanodeDescriptor的引用
  • triplets[3i+1]:指向该副本所在的DataNode中Block列表中的上一个Block的引用
  • triplets[3i+2]:指向该副本所在的DataNode中Block列表中的下一个Block的引用

 

6 INode相关的类

INode相关的类如下图所示:

 

INode: 是对文件系统目录结构中一个节点的抽象,也叫元数据。它用来存放文件及目录的基本信息:名称,父节点、修改时间,访问时间以及UGI信息等。 

INodeFile: 表示文件节点,继承自INode,除INode信息外,还有组成这个文件的Blocks列表,重复因子,Block大小等。 

INodeDirectory:表示目录节点,继承自INode,此外还有一个INode列表来组成文件或目录树结构。

INodeFileUnderConstruction:表示正在建的文件,继承自INodeFile。

INodeDirectoryWithQuota:表示有配额限制的目录,根目录就是这种类型,继承自INodeDirectory。

 

7 FSDirectory

FSDirectory存储整个文件系统的目录状态,对整个目录结构的管理。保存着 filename->blockset 的映射。FSDirectory通过调用fsimage和editLog的方法从NameNode本地磁盘读取元数据信息和向本地磁盘写入元数据信息,并登记对目录结构所作的修改到日志文件。

private final NameCache<ByteArray> nameCache;//缓存频繁使用的文件名,字节数组表示INode中的文件名。NameCache内部封装了Map。ByteArray内部封装了一个字节数组。这个字节数组在这里就表示文件的名称。

 

8 FSImage 相关的数据结构

 

 

 

 

 

9 DatanodeDescriptor相关数据结构

(1)Node

表示物理集群中一个节点,可以标识某个数据中心下面的某个机架中的某个节点。该接口提供了一些getter/setter方法,用于设置/获取节点的名称、网络位置等信息。

网络位置是这样的字符串“/dog/orange”,表示该节点位于dog数据中心下面的orange机架。节点名称可按如下表示:“hostname:port”。

(2)DatanodeID

name表示:"主机名:端口"。
storageID:每个集群唯一的storageID。

(3)DatanodeDescriptor

在继承DataNode本身的信息的基础上,还额外添加了与Block相关的信息。参考:http://sid1211.iteye.com/blog/1002488

 

 

 

 

 

 

 

 

 

总结:

几个关键映射表:

filename -> block[] ,谁负责?FSDirectory

block ->DataNode[] ,谁负责?BlocksMap

HDFS实际上具有两个功能:命名空间管理(Namespace management)和块/存储管理服务(block/storage management)。

 

参考资料

HDFS读写原理:

http://wenku.baidu.com/link?url=BmFDjL6AC1jAOtDt2RFlz8wyesPQIK3xujMX9hZzgCcKdn3AjGKLZr8MhN9csJp2HY4OjkgIMpPfz9h5mSLZBeuiy1whjp4EbgUwv1liT3e

 HDFS文件系统结构解析 http://weilaiyxj.iteye.com/blog/933553

http://www.cnblogs.com/wangyonghui/archive/2011/09/01/2162489.html

http://www.cnblogs.com/wangyonghui/archive/2011/09/07/2169565.html

StorageDirectory

http://www.linuxidc.com/Linux/2012-01/50867.htm

http://zy19982004.iteye.com/blog/1876706

HDFS Federation(HDFS 联盟)介绍http://blog.csdn.net/strongerbit/article/details/7013221/

 

posted @ 2015-03-03 18:51  凝静志远  阅读(898)  评论(0编辑  收藏  举报