1. 平均分布。即每个Reducer处理的Record数量应该尽可能相等。 2. 高效。由于每个Record在Map Reduce过程中都需要由Partitioner分配,它的效率至关重要,需要使用高效的算法实现。
a b c d e f g h i
Reducer0 [a, b, c] Reducer1 [d, e, f] Reducer2 [g, h, i]