摘要: 链接: 6.RDD综合练习:更丰富的操作 https://www.cnblogs.com/zh2597/p/16345425.html 7.Spark SQL https://www.cnblogs.com/zh2597/p/16345428.html 阅读全文
posted @ 2022-06-05 22:42 九月微凉 阅读(18) 评论(0) 推荐(0)
摘要: 1.请分析SparkSQL出现的原因,并简述SparkSQL的起源与发展 Hadoop刚开始出来的时候,使用的是hadoop自带的分布式计算系统MapReduce,但是MapReduce的使用难度较大,所以就开发了Hive,Hive编程用的是类SQL的HQL的语句,这样编程的难度就大大的降低了,Hi 阅读全文
posted @ 2022-06-05 22:37 九月微凉 阅读(44) 评论(0) 推荐(0)
摘要: 集合运算练习 union(), intersection(),subtract(), cartesian() 内连接与外连接 join(), leftOuterJoin(), rightOuterJoin(), fullOuterJoin() 多个考勤文件,签到日期汇总,出勤次数统计 三、 持久化  阅读全文
posted @ 2022-06-05 22:35 九月微凉 阅读(29) 评论(0) 推荐(0)