摘要: 一、状态 Spark 的状态 = 计算过程中需要持久化的中间结果 / 历史数据 状态分为三类: ① 轻量级状态: 分区级聚合,状态与分区强绑定,仅存储在当前分区内,Spark 全自动托管, 无需设置 Checkpoint、TTL,无需手动管理存储,默认内存优先存储,当单个分区的状态数据过大时,Spa 阅读全文
posted @ 2025-12-24 20:18 秋水依然 阅读(6) 评论(0) 推荐(0)