随笔分类 -  Hadoop

大数据
Hadoop处理大量小文件的问题和解决方法
摘要:HDFS的block size(默认64M),小文件指的是那些size比64M小的多的文件。如果在HDFS中存储小文件,那么在HDFS中肯定会含有许许多多这样的小文件(不然就不会用hadoop了)。而HDFS的问题在于无法很有效的处理大量小文件。任何一个文件,目录和block,在HDFS中都会被表示 阅读全文
posted @ 2016-04-14 20:09 天一直很蓝 阅读(679) 评论(0) 推荐(0)