摘要:
链接: 6.RDD综合练习:更丰富的操作 https://www.cnblogs.com/zh2597/p/16345425.html 7.Spark SQL https://www.cnblogs.com/zh2597/p/16345428.html 阅读全文
摘要:
1.请分析SparkSQL出现的原因,并简述SparkSQL的起源与发展 Hadoop刚开始出来的时候,使用的是hadoop自带的分布式计算系统MapReduce,但是MapReduce的使用难度较大,所以就开发了Hive,Hive编程用的是类SQL的HQL的语句,这样编程的难度就大大的降低了,Hi 阅读全文
摘要:
集合运算练习 union(), intersection(),subtract(), cartesian() 内连接与外连接 join(), leftOuterJoin(), rightOuterJoin(), fullOuterJoin() 多个考勤文件,签到日期汇总,出勤次数统计 三、 持久化 阅读全文