4.RDD操作

一、 RDD创建

1.从本地文件系统中加载数据创建RDD 

 

 

2.从HDFS加载数据创建RDD

  启动hdfs

 

   上传文件

 

   查看文件

 

   加载

 

   停止hdfs

 

 

3.通过并行集合(列表)创建RDD
  输入列表、字符串、numpy生成数组

 

 

 

二、 RDD操作

  转换操作

  1.filter(func)
    显式定义函数
    lambda函数

 

   2.map(func)
   显式定义函数
   lambda函数

 

 

  行动操作

 

 

 

 

  rdd.collect()

 

posted @ 2022-03-21 21:38  gewen  阅读(27)  评论(0)    收藏  举报