摘要: 一、 RDD创建 1.从本地文件系统中加载数据创建RDD 2.从HDFS加载数据创建RDD exit()退出上一步后启动hdfs上传文件且查看文件 进入spark加载刚刚传入hdfs的文件 不使用HDFS了,记得停止hdfs 3.通过并行集合(列表)创建RDD 输入列表字符串numpy生成数组 二、 阅读全文
posted @ 2022-03-24 19:39 偷猪少年会遇到 阅读(37) 评论(0) 推荐(0) 编辑