Terry's blog

Focus on bigdata and cloud.

博客园 首页 新随笔 联系 订阅 管理

2018年10月28日 #

摘要: 1. Spark RDD 创建操作 1.1 数据集合 parallelize 可以创建一个能够并行操作的RDD。其函数定义如下: 由定义可见有两个参数,第一个参数指定数据集合,第二个参数指定数据分区。 实例:由普通数组创建RDD scala> val data=Array(1,2,3,4,5,6,7 阅读全文
posted @ 2018-10-28 21:56 王晓成 阅读(2917) 评论(0) 推荐(0) 编辑