摘要:
MapReduce主要用于面向大规模数据集的并行计算,需要重点了解MapReduce的并行编程模型和运行机制。MapReduce计算模型主要由三个阶段构成:Map、shuffle、Reduce。Map和Reduce操作需要我们自己定义相应Map类和Reduce类。而shuffle则是系统自动帮我们实现的,是MapReduce的“心脏”,是奇迹发生的地方。 阅读全文
posted @ 2019-07-10 09:49
gzshan
阅读(1897)
评论(0)
推荐(0)

浙公网安备 33010602011771号