摘要: RDD算子 简单介绍 RDD(Resilient Distributed Dataset)是Apache Spark中的基本数据结构,它代表一个分布式、不可变的数据集。RDD提供了一系列的算子(操作符),用于在分布式计算中对数据进行转换和操作。这些算子可以分为两类:转换算子(Transformati 阅读全文
posted @ 2024-01-28 23:14 突破铁皮 阅读(54) 评论(0) 推荐(0) 编辑