会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
一个小秃头
博客园
首页
新随笔
联系
订阅
管理
2020年2月27日
RDD的缓存机制
摘要: Spark速度非常快的原因之一,就是在不同操作中可以在内存中持久化或者缓存数据集。当持久化某个RDD后,每一个节点都将把计算分区结果保存在内存中,对此RDD或衍生出的RDD进行的其他动作中重用。这使得后续的动作变得更加迅速。RDD相关的持久化和缓存,是Spark最重要的特征之一。可以说,缓存是Spa
阅读全文
posted @ 2020-02-27 10:08 一个小秃头
阅读(664)
评论(0)
推荐(0)
公告