江湖神经

导航

04 2022 档案

7.Spark SQL
摘要:1.请分析SparkSQL出现的原因,并简述SparkSQL的起源与发展。 因为关系数据库已经很流行,而且关系数据库在大数据时代已经不能满足要求。首先,用户需要从不同数据源执行各种操作,包括结构化、半结构化和非结构化数据。其次,用户需要执行高级分析,比如机器学习和图像处理。在实际大数据应用中,经常需 阅读全文

posted @ 2022-04-24 09:32 江湖神经 阅读(136) 评论(0) 推荐(0)

6. RDD综合练习:更丰富的操作
摘要:集合运算练习 union(), intersection(),subtract(), cartesian() 内连接与外连接 join(), leftOuterJoin(), rightOuterJoin(), fullOuterJoin() 多个考勤文件,签到日期汇总,出勤次数统计 三、综合练习: 阅读全文

posted @ 2022-04-12 13:00 江湖神经 阅读(88) 评论(0) 推荐(0)