摘要: RDD(弹性分布式数据集)。RDD以分区中的每一行进行分布式计算。父子依赖关系。 一、RDD创建操作 1)数据集合 Val data=Array(1, 2, 3, 4, 5, 6, 7, 8, 9) Val distData = sc.parallelize(data, 3) #分区,生成RDD数据 阅读全文
posted @ 2018-04-12 10:22 fionaplanet 阅读(404) 评论(0) 推荐(0)