4.RDD操作
一、 RDD创建
环境启动、文件准备:


1.从本地文件系统中加载数据创建RDD

2.从HDFS加载数据创建RDD

不同语句:

3.通过并行集合(列表)创建RDD
ps:不知为何会存在一定乱序

二、 RDD操作
1.转换操作
1.filter:


2.map:




3.flatMap:


4.groupByKey():

5.reduceByKey():


6.reduce():

7.sortByKey():

8.sortBy():

2.行动操作
count()/first()/take()/reduce()/collect()/foreach(print)/foreach(lambda):



浙公网安备 33010602011771号