《Data-intensive Text Processing with MapReduce》读书笔记第3章:MapReduce算法设计(4)
摘要:
本读书笔记的目录地址:http://www.cnblogs.com/mdyang/archive/2011/06/29/data-intensive-text-prcessing-with-mapreduce-contents.html3.4 二次排序在中间结果进入reducer之前,MapReduce会先将这些中间结果进行排序,然后再进行分发。这个机制对于依赖中间结果输入顺序(按照key的顺序)的reduce操作非常方便。反序(orderinversion)模式便是利用这个机制的一个例子。但如果有更进一步的排序需求呢(在前面的基础上再按value排序)?有了二次排序,能够保证到达reduce 阅读全文
posted @ 2011-07-20 14:16 mdyang 阅读(880) 评论(0) 推荐(0) 编辑