四、RDD操作

一、

1.从本地文件系统中加载数据创建RDD

2.从HDFS加载数据创建RDD

3.通过并行集合(列表)创建RDD

 

 

 二、

1.map(func)

2.filter(func):显式定义函数、lambda函数

 3.flatMap(func)

4.reduceByKey()

5. groupByKey()

6.sortByKey()

7.sortBy()

8.RDD写入文本文件

 

 

 

 

 

 

 

 

三、行动操作

1.foreach(print)

 

 


foreach(lambda a:print(a.upper())

2.collect()

3.count()

4.take(n)

 

5.reduce()

 

posted @ 2022-03-17 16:55  鸽子哥  阅读(64)  评论(0)    收藏  举报