Hadoop技术内幕HDFS-笔记11之HDFS

Hdfs文件系统,提供了一套基于hadoop的抽象文件系统的API,支持以流的方式访问文件系统中的数据。

特性:

1、  支持超大文件

2、  检测和快速应对硬件故障(故障检测和自动恢复)

3、  流式数据访问,注重的是数据的吞吐量,而不是数据的响应速度

4、  简化的一致性模型,一次写入,多次读取。

不适合:

5、  低延迟数据访问,和用户的实时交互,由于hadoop对高数据吞吐量进行了优化,而牺牲了数据的延迟,对于低延迟访问,可以考虑hbase或cassandra

 

1.1.1.          Hdfs体系结构

正常水平的副本数即副本系数

Namenode:

SNN:

Datanode:

客户端:

源码文件:org.apache.hadoop.hdfs包下

关于源码实现,可在实际工作需要的时候查看。

2.      基于远程调用的接口

Hdfs主要流程,在需要的时候可以详细分析一下。

 

 

 

 

posted @ 2014-07-02 23:09  jseven  阅读(188)  评论(0)    收藏  举报