摘要: MapReducer运行过程 以单词统计为案例。 假如现在文件中存在如下内容: aa bb aa cc dd aa 当然,这是小文件,如果文件大小较大时会将文件进行 “切片” ,此处的切片和 HDFS 的 “分块”概念不同。 “切片” 是将文件进行逻辑的划分,而 “分块” 是进行物理的划分。 即 “ 阅读全文
posted @ 2020-09-23 22:57 Nevesettle 阅读(693) 评论(0) 推荐(0)