spark RDD
摘要:RDD RDD是 的英文缩写,是spark的基本数据抽象,代表着一个不可变的、多分区的、可并行操作的元素集合。 RDD有5个主要属性: 分区列表 (partition list) 计算某个分区函数(compute) 依赖列表 (dependency list) _kv类型RDD的分区器_(可选的)
阅读全文
posted @ 2019-05-07 19:08
posted @ 2019-05-07 19:08