大数据05 MapReduce
MapReduce: 分布式并行编程, 也就是多台机器的 CPU 之间的并行编程.

MapReduce 帮你自动实现底层.

分而治之的策略:

理念:






实例:

两个文件, 统计这两个文件中单词的个数

key:单词, value:出现次数

reduce: key - value list. 用 Iterable 容器



这里的 Word Count 是类的名称

MapReduce: 分布式并行编程, 也就是多台机器的 CPU 之间的并行编程.

MapReduce 帮你自动实现底层.

分而治之的策略:

理念:







两个文件, 统计这两个文件中单词的个数

key:单词, value:出现次数

reduce: key - value list. 用 Iterable 容器



这里的 Word Count 是类的名称
