摘要: Spark 算子大致可以分为以下两类: 1)Transformation 变换/转换算子:这种变换并不触发提交作业。 这种操作是延迟计算的,也就是说从一个RDD 转换生成另一个 RDD的转换的操作并不会马上执行,而是要等到有 Action 操作的时候才会触发。 2)Action 行动算子:这类算子会 阅读全文