摘要: MapReduce主要用于面向大规模数据集的并行计算,需要重点了解MapReduce的并行编程模型和运行机制。MapReduce计算模型主要由三个阶段构成:Map、shuffle、Reduce。Map和Reduce操作需要我们自己定义相应Map类和Reduce类。而shuffle则是系统自动帮我们实现的,是MapReduce的“心脏”,是奇迹发生的地方。 阅读全文
posted @ 2019-07-10 09:49 gzshan 阅读(1897) 评论(0) 推荐(0)