摘要:        
在每个maptask的结束,我们拿到的是<K,V>的队列,在Reduce中,输入的是<K,Iterable V>。在中间有一个被称为Shuffle的工作,将Maptask的数据按Key排序。其主要的工作,大体上讲1.完整地从map task端拉取数据到reduce端。2.在跨节点拉取数据时,尽可能地    阅读全文
            
                posted @ 2020-02-25 23:38
星不予
阅读(233)
评论(0)
推荐(0)
            
         
                    
                 
 浙公网安备 33010602011771号
浙公网安备 33010602011771号