会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
一剑侵心
博客园
首页
新随笔
联系
管理
订阅
2017年12月13日
Spark RDD(Resilient Distributed Dataset)
摘要: 基于数据集的处理:从物理存储上加载数据,然后操作数据,然后写入物理存储设备。比如Hadoop的MapReduce。 缺点:1.不适合大量的迭代 2. 交互式查询 3. 不能复用曾经的结果或中间计算结果 基于工作集的处理:如Spark的RDD。RDD具有如下的弹性: 1. 自动的进行内存和磁盘数据存储
阅读全文
posted @ 2017-12-13 21:28 一剑侵心
阅读(1541)
评论(0)
推荐(0)
公告