第四次作业

一、 RDD创建

  1.从本地文件系统中加载数据创建RDD

   

  1. 从HDFS加载数据创建RDD
    启动hdfs

  • 上传文件

  • 查看文件
  • 加载

  • 停止hdfs
  1. 通过并行集合(列表)创建RDD
    输入列表
    字符串
    numpy生成数组

    

二、 RDD操作

转换操作

  1. filter(func)
    显式定义函数
    lambda函数

    

 

  1. map(func)
    显式定义函数
    lambda函数

行动操作

      1. foreach(print)
        foreach(lambda a:print(a.upper())
      •  

         

      1. collect()
      2.  

         

posted @ 2022-03-22 00:34  啊bin  阅读(36)  评论(0)    收藏  举报