百里登风

导航

2020年1月17日

6.Pair RDD操作

摘要: 1.1 键值对RDD操作 Mapreduce框架是把数据转为key-value,再聚合为key-values的过程。 在Spark里key-value RDD(pair RDD)同样是最常用的,在每个应用中基本都会用到。 pair RDD如何创建?不是通过sc.parallelize 创建 通常应用 阅读全文

posted @ 2020-01-17 11:46 百里登峰 阅读(310) 评论(0) 推荐(0) 编辑