大数据05 MapReduce

MapReduce: 分布式并行编程, 也就是多台机器的 CPU 之间的并行编程.

 

MapReduce 帮你自动实现底层.

 

分而治之的策略:

 

理念:

 

 

 

 

 

 

 

 

 

 

 

 实例:

 

两个文件, 统计这两个文件中单词的个数

 

 

 key:单词, value:出现次数

 

reduce: key - value list. 用 Iterable 容器

 

 

 

 

 

 这里的 Word Count 是类的名称

 

 

posted @ 2020-02-29 13:58  神之一招  阅读(179)  评论(0编辑  收藏  举报