4.RDD操作

一、 RDD创建

  1. 从本地文件系统中加载数据创建RDD
  2. 从HDFS加载数据创建RDD
    启动hdfs
    上传文件
    查看文件
    加载
    停止hdfs
  3. 通过并行集合(列表)创建RDD
    输入列表、字符串、生成数组

 

 

 

 

 

 

 

 

 

 

 

 

二、 RDD操作

转换操作

map(func)
显式定义函数
lambda函数

行动操作

 foreach(print)
foreach(lambda a:print(a.upper())

collect()

 

 

 

 

 

 

 

 

 

 

 

posted on 2022-03-22 15:16  桃花雨诺  阅读(7)  评论(0编辑  收藏  举报