Hadoop HDFS 文件块大小

HDFS中的文件在物理上是分块存储(Block),块的大小可以通过配置参数(dfs.blocksize)来配置,默认大小在Hadoop2.x/3.x版本中是128M,1.x版本中是64M.
建议配置为物理机硬盘每秒的读取速度,如机械硬盘则建议为128M,SSD则配置为256M。

  • HDFS的块设置太小,会增加寻址时间,程序一直在找块的开始位置。
  • 如果块设置的太大,从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间,导致程序在处理这块数据时,会非常慢
  • HDFS块的大小设置主要取决于硬盘传输速率(读的速度)
posted @ 2023-12-10 10:56  SpringCore  阅读(52)  评论(0编辑  收藏  举报