4.RDD操作

一、RDD的创建

1.从本地文件系统中加载数据创建RDD

 

 

 

 2.从HDFS加载数据创建RDD、启动hdfs、上传文件、查看文件、加载

 

3.通过并行集合(列表)创建RDD

 

 

 

 二、RDD的操作

转换操作

 1.filter(func)    lambda函数

显式定义函数

 

 2.map(func)

显式定义函数
lambda函数

 

 

3.flatMap(func)

 

 

 

 

 

4.reduceByKey()

 

 

 

  5.groupByKey()

 

 

 

 

 6.sortByKey()

 

 7.sortBy()

 

 8.RDD写入文本文件

 

 

 行动操作

1.foreach(print)

 

 2.foreach(lambda a:print(a.upper())

 

 3.collect()

 

posted @ 2022-03-22 00:22  xhm11111  阅读(21)  评论(0)    收藏  举报