随笔分类 -  ChainMapper/ChainReducer原理、实战

Hadoop的ChainMapper和ChainReducer实战
摘要:Hadoop的MR作业支持链式处理,类似在一个生产牛奶的流水线上,每一个阶段都有特定的任务要处理,比如提供牛奶盒,装入牛奶,封盒,打印出厂日期,等等,通过这样进一步的分工,从而提高了生产效率,那么在我们的Hadoop的MapReduce中也是如此,支持链式的处理方式,这些Mapper像Linux管道... 阅读全文
posted @ 2014-08-15 11:23 netskill 阅读(371) 评论(0) 推荐(0)
ChainMapper/ChainReducer 的实现原理
摘要:ChainMapper/ChainReducer 主要为了解决线性链式Mapper 而提出的。也就是说,在Map 或者Reduce 阶段存在多个Mapper,这些Mapper 像Linux 管道一样,前一个Mapper的输出结果直接重定向到下一个Mapper 的输入,形成一个流水线,形式类似于[MA... 阅读全文
posted @ 2014-08-15 11:21 netskill 阅读(415) 评论(0) 推荐(0)