Hadoop 学习笔记 (2) -- 关于MapReduce

1. MapReduce
    定义:
    是一种可用于数据处理的编程的模型
    优势:
    MapReduce 本质上是并行运行的,因此可以将大规模的数据分析任务,分发给任何一个拥有足够多机器的
    的数据中心。
    MapReduce 的优势在于处理大规模数据集。
    过程: (map 和 reduce)
        每个阶段都已 键值对 作为输入和输出
    图例:
        map 函数
           |
           |
    MapReduce 框架处理
           |
           |
      reduce 函数

 

posted on 2017-06-02 10:15  零零多  阅读(129)  评论(0)    收藏  举报

导航