摘要:
Spark 中最基本的数据抽象是 RDD。 RDD:弹性分布式数据集 (Resilient Distributed DataSet)。 不可变,分区,并行 Spark的算子的分类 (1)Transformation 变换/转换算子:这种变换并不触发提交作业,完成作业中间过程处理。 Value数据类型 阅读全文
posted @ 2020-09-18 19:20
happygril3
阅读(320)
评论(0)
推荐(0)

浙公网安备 33010602011771号