hadoop入门学习系列之二hadoop的mapreduce的wordcount流程介绍

map reduce 流程如下: 

 

map与reduce的输入输出都是键值对。

map 的输入是 <0,"till good is better"> ,

                      <19,"and better is best">

是每行开始读取的,0是指字符开始的位置

map的输出是 <till,1>这种<word,1>的格式。

reduce的输入是<key,list(value)> 的形式

输出是<word,count>的格式。

posted @ 2017-07-06 13:58  love fendi  阅读(145)  评论(0编辑  收藏  举报