4.RDD操作

一、 RDD创建

1.从本地文件系统中加载数据创建RDD

 

2.从HDFS加载数据创建RDD

启动hdfs

上传文件

查看文件

加载

 

停止hdfs

 

3.通过并行集合(列表)创建RDD

输入列表

字符串

numpy生成数组

 

二、 RDD操作

转换操作

1.map(func)

显式定义函数

lambda函数

 

 

2.filter(func)

显式定义函数

lambda函数

 

 

三、行动操作

1.foreach(print)

foreach(lambda a:print(a.upper())

 

2.collect()

 

 

 
 
posted @ 2022-03-23 11:43  闻风Wioshgau  阅读(33)  评论(0)    收藏  举报