摘要: Spark RDD的简介 什么是RDD? RDD是整个Spark的基石,是一个弹性分布式的数据集,为用户屏蔽了底层复杂的计算和映射操作。 RDD的特点: RDD 是不可变的,如果对一个RDD进行转换操作会生成一个新的RDD。 RDD 是分区的,RDD 里面的具体数据是分布在多台机器上的 Excuto 阅读全文
posted @ 2020-08-28 11:43 JunCode 阅读(344) 评论(0) 推荐(2)