会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
郝凡的博客
用结构化的框架去展示非结构化的数据
博客园
首页
新随笔
联系
订阅
管理
2016年7月21日
Spark学习笔记
摘要: 1. 什么是RDD? Resilient Distributed Dataset弹性分布式数据集,能够横跨集群所有节点进行并行计算的分区元素的集合。 2. Spark中两种类型的共享变量 一是广播变量(broadcast variables),用来在所有节点内存中缓存一个值;另外一种是累加器(acc
阅读全文
posted @ 2016-07-21 10:26 郝凡
阅读(1241)
评论(0)
推荐(0)
公告