会员
周边
新闻
博问
融资
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
liyiyang
博客园
首页
新随笔
联系
管理
订阅
2024年1月29日
saprk三大数据结构之RDD的依赖关系
摘要: RDD依赖关系 (1)RDD血缘关系 相邻两个RDD的关系称之为依赖关系 多个连续的RDD依赖关系称之为血缘关系 每个RDD会保存血缘关系 RDD不保存数据 因此一旦出现报错需要从头开始读取 RDD为了提供容错性,需要将RDD间的关系保存下来 一旦出现错误就可以根据血缘关系将数据源重新读取进行计算
阅读全文
posted @ 2024-01-29 23:58 突破铁皮
阅读(4)
评论(0)
推荐(0)
编辑
公告