4.RDD操作

1.从本地文件系统中加载数据创建RDD

 

2.从HDFS加载数据创建RDD

启动hdfs

上传文件

 

 查看文件

 

加载

 

 停止hdfs

 

 

3.通过并行集合(列表)创建RDD

 输入列表、字符串、生成数组

 

 

二、 RDD操作

转换操作

  

1.转换操作

(1)filter(func)

 

 

 

(2)map(func)

 

 

行动操作

1.foreach(print)
foreach(lambda a:print(a.upper())

2.collect() 

 

 

posted @ 2022-03-22 15:39  谢林展  阅读(47)  评论(0)    收藏  举报