摘要: 1) union(otherRDD)RDD-->UnionRDD2) groupByKey(numPartitions)RDD-->ShuffledRDD-->MapPartitionsRDDgroupByKey() 只需要将 Key 相同的 records 聚合在一起,一个简单的 shuffle ... 阅读全文
posted @ 2014-10-30 18:34 liutoutou 阅读(1099) 评论(0) 推荐(0) 编辑