第五章_Spark核心编程_Rdd算子的分类与定义

1. 什么是Rdd 算子
    rdd的方法 => rdd的算子 => rdd的操作

2. Rdd 算子的分类
    1. Transformation(转换) 算子
         Transformation 操作是延迟计算的
         也就是说 一个RDD转换生成另一个RDD操作时是不会马上执行的,需要等待有Actions操作时,才会触发

     根据操作Rdd元素的类型可以分为
value型、double value型、key-value型
2. Action(行动) 算子 Action算子 会触发Spark提交作业(Job),并将数据输出到Spark系统

 

posted @ 2022-03-22 18:39  学而不思则罔!  阅读(89)  评论(0)    收藏  举报