HDFS 文件块大小——悟空智慧教育

HDFS中的文件在物理上是分块存储(block),块的大小可以通过配置参数( dfs.blocksize)来规定,默认大小在hadoop2.x版本中是128M,老版本中是64M

HDFS的块比磁盘的块大,其目的是为了最小化寻址开销。如果设置得足够大,从磁盘传输数据的时间会明显大于定位这个开始位置所需的时间。因而传输一个由多个块组成的文件的时间取决于磁盘传输速率。

如果寻址时间约为10ms,而传输速率为100MB/s,为了使寻址时间仅占传输时间的1%,我们要将块大小设置约为100MB。默认块大小实际为64MB,但是很多情况下HDFS使用128MB的块设置。

的大小:10ms*100*100M/s = 100M

以上文章内容来源于《悟空智慧教育》:www.wukongone.com,《悟空智慧教育》是一家专业的大数据视频教学网,专属定制您的未来。

posted @ 2019-11-27 18:53  大数据-云计算  阅读(621)  评论(0)    收藏  举报