摘要: RDD(Resilient Distributed Datasets)弹性分布式数据集。RDD可以看成是一个简单的"数组",对其进行操作也只需要调用有限的"数组"中的方法即可,但它与一般数组的区别在于:RDD是分布式存储,可以跟好的利用现有的云数据平台,并在内存中进行。此处的弹性指的是数据的存储方式 阅读全文
posted @ 2017-09-09 13:11 追求沉默者 阅读(591) 评论(0) 推荐(1) 编辑