摘要: hdfs以流式数据访问模式来存储超大文件,运行于商用硬件集群上。 优点 支持超大文件存储 “超大文件”在这里指的是几百MB,几百GB,甚至几百TB大小的文件。目前已经有存储PB级数据的Hadoop集群了。 流式数据访问 一次性写入,多次读取是最高效的访问模式。 数据集通常由数据源生成或从数据源复制而 阅读全文
posted @ 2018-08-09 20:50 codedou 阅读(799) 评论(0) 推荐(0)