4.RDD操作

1.从本地文件系统中加载数据创建RDD

输入spark-shell 进入spark-shell环境
image

2.从HDFS加载数据创建RDD

启动hdfs

输入 start-all.sh 启动hdfs

image

上传文件

image

查看文件

image

加载

image

停止hdfs

image

3.通过并行集合(列表)创建RDD
输入列表、字符串、生成数组
image

二、 RDD操作

转换操作

image

行动操作

image

image

posted @ 2022-03-22 14:12  ../已被使用  阅读(33)  评论(0)    收藏  举报