• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
涌ysy
博客园    首页    新随笔    联系   管理    订阅  订阅
4.RDD操作

一、 RDD创建

    1. 从本地文件系统中加载数据创建RDD
    2. 从HDFS加载数据创建RDD
      启动hdfs
      上传文件
      查看文件
      加载
      停止hdfs
    3. 通过并行集合(列表)创建RDD
      输入列表、字符串、生成数组

1.从本地文件系统中加载数据创建RDD

 

 

 

 

 

2.从HDFS加载数据创建RDD

  启动hdfs
      上传文件
  查看文件
  加载
  停止hdfs

 

 

 

 

 

 

 3.通过并行集合(列表)创建RDD

  输入列表、字符串、生成数组

 

 

二、 RDD操作

转换操作

 

 

 

 

行动操作

    1. foreach(print)
      foreach(lambda a:print(a.upper())
    2. collect()

 

 

 

 

posted on 2022-03-25 19:53  涌ysy  阅读(32)  评论(0)    收藏  举报
刷新页面返回顶部
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3