摘要: 1. Spark 的核心概念 RDD(弹性分布式数据集):Spark 的基础数据结构,是不可变的分布式数据集合,支持容错和并行操作。 DAG(有向无环图):Spark 通过 DAG 来表示任务的执行计划,优化计算过程。 Executor(执行器):运行在集群节点上的进程,负责执行任务和存储数据。 D 阅读全文
posted @ 2025-02-10 20:29 Hbro 阅读(7) 评论(0) 推荐(0)