会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
data-agent
博客园
首页
新随笔
联系
订阅
管理
2025年12月24日
状态、水印 、checkpoint
摘要: 一、状态 Spark 的状态 = 计算过程中需要持久化的中间结果 / 历史数据 状态分为三类: ① 轻量级状态: 分区级聚合,状态与分区强绑定,仅存储在当前分区内,Spark 全自动托管, 无需设置 Checkpoint、TTL,无需手动管理存储,默认内存优先存储,当单个分区的状态数据过大时,Spa
阅读全文
posted @ 2025-12-24 20:18 秋水依然
阅读(6)
评论(0)
推荐(0)
公告