会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
佚名博主
博客园
首页
新随笔
联系
订阅
管理
2020年3月22日
RDD缓存与持久化
摘要: RDD缓存: RDD缓存是spark中的重要特性。默认情况下,RDD的内容是临时的,每个RDD只能使用一次,如果某个RDD需要重复使用则需要从最开始的父RDD重新计算,计算量较大且耗时,使用缓存或持久化后,第一次计算出RDD内容之后,可以将每个RDD的结果缓存在集群的内存或磁盘中,后续调用以来该RD
阅读全文
posted @ 2020-03-22 23:00 佚名博主
阅读(297)
评论(0)
推荐(0)
公告