摘要: 一、 RDD创建 1. 启动pyspark 2. 从HDFS加载数据创建RDD 2.1 启动hdfs,上传文件 2.2 查看文件,加载文件 2.3 停止HDFS 3. 通过并行集合(列表)创建RDD 3.1输入列表、字符串、生成数组 二、 RDD操作 转换操作 1.filter(func): 1.1 阅读全文
posted @ 2022-03-16 16:59 Hushub桓 阅读(50) 评论(0) 推荐(0)
Live2D