会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
dataAlpha
博客园
首页
新随笔
联系
订阅
管理
2018年4月12日
sparkRDD相关操作
摘要: RDD(弹性分布式数据集)。RDD以分区中的每一行进行分布式计算。父子依赖关系。 一、RDD创建操作 1)数据集合 Val data=Array(1, 2, 3, 4, 5, 6, 7, 8, 9) Val distData = sc.parallelize(data, 3) #分区,生成RDD数据
阅读全文
posted @ 2018-04-12 10:22 fionaplanet
阅读(404)
评论(0)
推荐(0)
公告