2022年3月28日
摘要: 一、 RDD创建 1.从本地文件系统中加载数据创建RDD 2.从HDFS加载数据创建RDD exit()退出上一步后启动hdfs上传文件且查看文件 进入spark加载刚刚传入hdfs的文件 不使用HDFS了,记得停止hdfs 3.通过并行集合(列表)创建RDD 输入列表字符串numpy生成数组 二、 阅读全文
posted @ 2022-03-28 23:00 云往前面飘 阅读(36) 评论(0) 推荐(0)