摘要:
第 3 章 RDD 编程 目录: 3.1 RDD基础 3.2 创建RDD 3.3 RDD操作 3.4 向spark传递函数 3.5 常见的RDD操作 3.6 持久化 3.1 RDD基础 RDD(Resilient Distributed Dataset):弹性分布式数据集,是一个不可变的分布式对象集 阅读全文
posted @ 2020-10-30 15:47
一路向北321
阅读(174)
评论(0)
推荐(0)
摘要:
第 2 章 Spark 下载与入门 2.1 下载Spark 略 2.2 Spark中Python和Scala的shell 略 2.3 Spark核心概念简介 以Python 版的例子介绍saprk核心概念 例 2-1:Python 行数统计# 1、驱动器程序:交互式运行spark,Spark she 阅读全文
posted @ 2020-10-30 15:44
一路向北321
阅读(172)
评论(0)
推荐(0)

浙公网安备 33010602011771号