会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
好好学习,天天向上
啦啦啦啦,一起来自学打卡,冲冲冲~
首页
新随笔
联系
订阅
管理
2021年2月9日
《Python+Spark 2.0+Hadoop》第10章 Python Spark RDD 读书笔记 (转换/动作运算、广播变量、累加器、示例略)
摘要: 第10章 Python Spark RDD RDD概念: Spark的核心是RDD,即是弹性分布式数据集,是一种分布式的内存系统数据集的应用;Spark的主要优势来自RDD本身的特性,RDD能与其他系统兼容,可以导入外部存储系统的数据集,例如HDFS、HBase、Hadoop数据源。 10.1 RD
阅读全文
posted @ 2021-02-09 15:34 山枫叶纷飞
阅读(146)
评论(0)
推荐(0)
公告