Spark RDD

RDD(Resilient Distributed Dateset),弹性分布式数据集。

 

 

◆哪里体现RDD的弹性?

  • 1.partition的个数可多可少
  • 2.RDD之间有依赖关系

 

◆哪里体现RDD的分布式?

  • RDD中的partition是分布在多个节点上的
posted @ 2019-04-25 10:54  梦醒江南·Infinite  阅读(115)  评论(0编辑  收藏  举报