RDD 中transformation的groupBy,partitionBy,cogroup详解--(视频笔记)

groupBy

针对key进行分组操作。

partitionBy
原有partitioner和现在partitioner不同才触发重新分片,如果一直则不会触发
一般都是根据key进行分片的。

cogroup
协同,针对两个RDD进行协同划分
返回的结果,key-value value为两个数据的集合的迭代器。

posted @ 2015-12-29 14:10  逸新  阅读(703)  评论(0编辑  收藏  举报