第五章_Spark核心编程_Rdd算子的分类与定义
1. 什么是Rdd 算子 rdd的方法 => rdd的算子 => rdd的操作 2. Rdd 算子的分类 1. Transformation(转换) 算子 Transformation 操作是延迟计算的 也就是说 一个RDD转换生成另一个RDD操作时是不会马上执行的,需要等待有Actions操作时,才会触发
根据操作Rdd元素的类型可以分为
value型、double value型、key-value型
2. Action(行动) 算子 Action算子 会触发Spark提交作业(Job),并将数据输出到Spark系统

浙公网安备 33010602011771号