spark技术总结(1)
摘要:1. 请描述spark RDD原理与特征 RDD为Resilient Distributed Datasets缩写,译文弹性分布式数据集。 他是spark系统中的核心数据模型之一,另外一个是DAG模型。 它是“只读”,“分区”的数据集合。其类内部有5个部分组成: 1. 一组partition par
阅读全文
posted @ 2018-06-19 17:21
posted @ 2018-06-19 17:21
posted @ 2017-12-15 15:23
posted @ 2016-10-26 14:38