04 2022 档案
摘要:集合运算练习 union(), intersection(),subtract(), cartesian() 内连接与外连接 join(), leftOuterJoin(), rightOuterJoin(), fullOuterJoin() 多个考勤文件,签到日期汇总,出勤次数统计 三、综合练习:
阅读全文
摘要:4RDD 一、 RDD创建 1.从本地文件系统中加载数据创建RDD 2.从HDFS加载数据创建 3.通过并行集合(列表)创建RDD 输入列表,字符串,numpy生成数组 二、 RDD操作 转换操作 1. map(func) 2. filter(func) 行动操作 1.foreach(print)
阅读全文