随笔分类 - Hadoop
大数据
Hadoop处理大量小文件的问题和解决方法
摘要:HDFS的block size(默认64M),小文件指的是那些size比64M小的多的文件。如果在HDFS中存储小文件,那么在HDFS中肯定会含有许许多多这样的小文件(不然就不会用hadoop了)。而HDFS的问题在于无法很有效的处理大量小文件。任何一个文件,目录和block,在HDFS中都会被表示
阅读全文
浙公网安备 33010602011771号