摘要: 今天我开始学习spark基础知识,首先从他的基本概念和理论开始入手: RDD(Resilient Distributed Dataset): RDD 是 Spark 提供的一个抽象数据类型,代表一个可以分布式计算的数据集合。它是 Spark 中最基本的数据结构,具有以下特点: 分区(Partitio 阅读全文
posted @ 2024-02-07 18:00 漏网鲨鱼 阅读(12) 评论(0) 推荐(0)