MapReduce

  参考资料:

  1. "MapReduce: Simplified Data Processing on Large Clusters" by Den & Ghemawat, 2004

  2. 上边论文的中文版:http://www.cnblogs.com/fuzhe1989/p/3413457.html

  3. C++ MapReduce

  4. 用通俗易懂的大白话讲解Map/Reduce原理

  5. 用通俗易懂的话说下hadoop是什么,能做什么

 

  

  知识点:

  ● MapReduce是一种编程模型,是关于处理和产生大数据集的一种实现。Map(映射)方法用来处理键/值对,并生成中间键/值对集。Reduce(归约)方法整合所有拥有相同中间键的中间值。按照这种方式写出的程序会自动并行,运行在一个大的商业计算机集群上。运行时系统负责具体的输入数据的划分、在大集群中的计算机上的程序的执行调度、计算机运行失败的处理以及对所中间计算机通信进行管理。因此,这不要求程序员拥有并行和分布式系统的经验,就能容易地使用一个大的分布式系统中的资源。

  

posted @ 2016-07-02 21:50  motein  阅读(198)  评论(0编辑  收藏  举报