HDFS读文件详解

通过对客户端简单读取数据的源码(见图3.1)的执行进行跟踪,可以窥探到客户端是如何读取到数据的。

图3.1 客户端简单读取数据的源码

下面开始解释第5行到第12代码:

第5行:根据文件的名字fileName构造一个Path类的对象path。

第6行:初始化一个Configuration变量conf。

第7行:根据path的成员函数getFileSystem()传入参数conf获得文件系统hdfs变量。

以上三行根据文件名,得到一个FileSystem类的对象hdfs,其实hdfs是FileSystem子类DistributedFileSystem的一个对象。此处hdfs为何为DistributedFileSystem一个对象,由于和需求无关,故不作深入解释,你只需知道hdfs是根据conf变量和文件名fileName决定的就可以了。

第8行:文件系统变量hdfs调用open()方法传入参数path得到一个输入流。

此处对open方法进行详细解释。

 

 

3.1 hdfs.open()详解

 

 

 

3.1.1 FileSystem.open(path)

 

Hdfs.open(path)是调用基类FileSystem的open(path)函数,图3.2为FileSystem的open()函数:

图3.2 FileSystem的open(path)函数

FileSystem.open(path)又调用FileSystem的抽象方法open(path, size)。

3.1.2 FileSystem.open(path, size)

图3.3为FileSystem的open(path, size)函数:

 

 

 

图3.3 FileSystem的抽象方法open(path, size)

抽象方法的实现是在子类中实现的,故实际调用的是子类的DistributedFileSystem实现的open(path, size)方法。

此处为何代码"FileSystem hdfs=path.getFileSystem(conf)"返回的是子类DistributedFileSystem的一个实例,这是根据path和conf共同决定的,具体分析,详见以后的分析,此处先不详述。

 

3.1.3 DistributedFileSystemd.open(path, size)

 

图3.4为DistributedFileSystem.open(path, size)的实现:

图3.4 DistributedFileSystemd的open(path, size)

图3.4中188行的dfs为DFSClient类的一个实例,DFSClient通过代理模式(用到了hadoop实现的RPC类)建立与NameNode的socket连接,具体细节不必深究,只需要知道DFSClient的功能即可。DFSClient的open(String src, int buffersize, boolean verifyChecksum, FileSystem.Statistics stats)方法返回一个DFSInputStream对象。

3.1.4 DFSClient.open(String src, int buffersize, boolean verifyChecksum, FileSystem.Statistics stats)

图3.5为DFSClient的open(String src, int buffersize, boolean verifyChecksum, FileSystem.Statistics stats)实现:

图3.5 DFSClient的open()方法

第478行检测clientRunning是否正在运行。

第480行根据DFSInputStream的构造函数:

DFSInputStream(String src, int buffersize, boolean verifyChecksum)构造一个DFSInputStream对象,DFSInputStream对象的构造详见3.1.5节。

 

3.1.5 DFS.checkOpen()

 

图3.6 DFS的checkOpen()方法

检测clientRunning是否正在运行,没有运行则抛出异常。

 

3.1.6 DFSInputStream.DFSInputStream(String src, int buffersize, boolean verifyChecksum)

 

DFSInputStream的构造函数见下图3.7:

图3. 7 DFSInputStream构造函数

DFSInputStream构造函数的前四行(即1682、1683、1684、1685行),分别在初始化一些参数;第1686行的openInfo(),它内部建立了与NameNode 的连接,通过调用DFSClient的callGetBlockLocations(namenode, src, 0, prefetchSize)

 

3.1.7 DFSInputStream.openInfo()

 

DFSInputStream. openInfo()详见下图3.8:

图3.8 DFSInputStream. openInfo()

图3.8的1693行调用DFSClient的方法callGetBlockLocations()。

callGetBlockLocations()函数的定义可以看出,它是调用了namenode 的getBlockLocations()方法;而namenode 的getBlockLocations()方法为:依据代理实现的对NameNode进行的远程过程调用,详见3.1.7节。

在第一次调用openInfo()时,DFSInputStream类的成员变量locatedBlocks为NULL,故不会执行图3.8的1700到1709这段代码。

第1710行updateBlockInfo(newInfo),在文件构造过程中,基于从datanode返回的block长度,更新最后一个block的大小。

第1711行,将DFSClient的callGetBlockLocations(namenode, src, 0, prefetchSize)方法返回的LocatedBlock变量赋给DFSClient的成员locatedBlocks。

3.1.8 DFSClient.callGetBlockLocations()

DFSClient的方法callGetBlockLocations()详见图3.9:

图3.9 DFSClient的callGetBlockLocations()

由图3. 9中callGetBlockLocations()函数的定义可以看出,它调用了namenode 的getBlockLocations()方法;而namenode 的getBlockLocations()方法为:依据代理实现的对NameNode进行的远程过程调用。namenode变量为一个ClientProtocol对象。

图3.10 ClientProtocol接口的getBlockLocations()

3.1.9 DFSInputStream.updateBlockInfo(LocatedBlocks newInfo)

图3. 11 DFSInputStream.updateBlockInfo(LocatedBlocks newInfo)

DFSInputStream的updateBlockInfo(LocatedBlocks newInfo),在文件构造过程中,基于从datanode返回的block长度,更新最后一个block的大小。

3.2 FSDataInputStream.read()详解

下面通过对读文件简单例子的分析,得出最外层面向开发者的FSDataInputStream.read(byte b[], int off, int len)的本质,最后帮助修改,解决需求(指定DataNode进行数据块读取)。

图3.12 客户端简单读取数据的源码

由图3.12第8行:

FSDataInputStream inputStream=hdfs.open(path);

可以看出open()函数返回了一个FSDataInputStream流对象,然后对这个流对象就行读操作,从表象看来确实如此,其实不然。

3.2.1 FSDataInputStream.read(byte b[], int off, int len)

究其实现可以看出,FSDataInputStream.read(byte b[], int off, int len)调用的是其父类DataInputStream的read(byte b[], int off, int len),图3.13为FSDataInputStream的继承关系:

图3.13 FSDataInputStream继承关系

3.2.2 DataInputStream.read(byte b[], int off, int len)

DataInputStream. read(byte b[], int off, int len)调用的是其成员的in的read(byte b[], int off, int len),见图3.14:

图3.14 DataInputStream. read(byte b[], int off, int len)

此处的read()需要特殊说明一下,in的read是从输入流in中读取长度为len的数据存放在b[] byte数组的off之后(包括off)的元素中,而不是我们通常所理解的那样。下面为英文解释:

The first byte read is stored into element b[off], the next one into b[off+1], and so on. The number of bytes read is, at most, equal to len. Let k be the number of bytes actually read; these bytes will be stored in elements b[off] through b[off+k-1], leaving elements b[off+k] through b[off+len-1] unaffected.

3.2.3 DataInputStream.in是什么

DataInputStream的成员in是什么呢,我们看其父类FilterInputStream,图3.15:

图3.15 FilterInputStream的成员变量in

    追溯到FilterInputStream类就知道了:

FSDataInputStream.read(byte b[], int off, int len)调用其父类DataInputStream的read(byte b[], int off, int len);

DataInputStream的read(byte b[], int off, int len)调用的是其成员变量InputStream in的read方法(byte b[], int off, int len)。

此处又出现了一个问题,这个类型为InputStream的in(真正的输入流)是怎么传进来的。

3.2.4 真正的输入流in

下面通过DFSInputStream类的继承关系和hdfs.open(path)的部分过程详解真正的输入流的构造生成过程。

图3.16 DFSInputStream类继承关系

图3.17 hdfs.open()获得流过程

我们由图3.17的hdfs.open()获得流过程的代码由下向上看(也可借鉴3.1.3小节)。

第30行构造了一个DFSInputStream变量并返回(此处记为a,方便下面描述解释)。

第15行的dfs.open(……)的返回值就是上一行所述的构造的DFSInputStream变量a。

第14行是根据15行构造的DFSInputStream变量a作为DFSClient的内部类DFSDataInputStream的构造函数的参数,下图3.18为DFSDataInputStream的构造函数的执行过程:

图3.18 DFSDataInputStream的构造函数的执行过程

由图3.18可以看出,执行到最后,其实是将DFSInputStream类的对象a赋给DFSDataInputStream类的成员变量in,类DFSDataInputStream类的成员变量in为InputStream类型。

故图3.17的第14行最后返回了一个(带有类型为DFSInputStream的输入流in的成员变量)DFSDataInputStream对象。

图3.17的第9行返回一个DFSDataInputStream对象。

图3.17的第8行返回一个DFSDataInputStream对象。

故图3.17的第1行:

FSDataInputStream inputStream=hdfs.open(path);

返回了一个(带有类型为DFSInputStream的输入流in的成员变量)DFSDataInputStream对象,到最后返回给它的直接父类FSDataInputStream的对象。下面一节对DFSInputStream的read()方法进行分析。

附件1

hdfs.open(path)执行流程:

posted on 2013-04-25 16:17  maybob  阅读(1805)  评论(0编辑  收藏  举报