4.RDD操作

一、 RDD创建

环境启动、文件准备:

 

1.从本地文件系统中加载数据创建RDD

 

2.从HDFS加载数据创建RDD

不同语句:

 

3.通过并行集合(列表)创建RDD

ps:不知为何会存在一定乱序

 

 

 

二、 RDD操作

 1.转换操作

1.filter:

 

 

2.map:

 

3.flatMap:

 

 

4.groupByKey():

 

 

5.reduceByKey():

6.reduce():

7.sortByKey():

8.sortBy():

 

 

 

 

2.行动操作

count()/first()/take()/reduce()/collect()/foreach(print)/foreach(lambda):

 

posted @ 2022-03-28 18:27  软工1901-吴兴  阅读(45)  评论(0)    收藏  举报