摘要:
链接: 6.RDD综合练习:更丰富的操作 https://www.cnblogs.com/zh2597/p/16345425.html 7.Spark SQL https://www.cnblogs.com/zh2597/p/16345428.html 阅读全文
posted @ 2022-06-05 22:42
九月微凉
阅读(18)
评论(0)
推荐(0)
摘要:
1.请分析SparkSQL出现的原因,并简述SparkSQL的起源与发展 Hadoop刚开始出来的时候,使用的是hadoop自带的分布式计算系统MapReduce,但是MapReduce的使用难度较大,所以就开发了Hive,Hive编程用的是类SQL的HQL的语句,这样编程的难度就大大的降低了,Hi 阅读全文
posted @ 2022-06-05 22:37
九月微凉
阅读(44)
评论(0)
推荐(0)
摘要:
集合运算练习 union(), intersection(),subtract(), cartesian() 内连接与外连接 join(), leftOuterJoin(), rightOuterJoin(), fullOuterJoin() 多个考勤文件,签到日期汇总,出勤次数统计 三、 持久化 阅读全文
posted @ 2022-06-05 22:35
九月微凉
阅读(29)
评论(0)
推荐(0)

浙公网安备 33010602011771号