05 2022 档案

摘要:综合练习:学生课程分数 网盘下载sc.txt文件,分别用RDD操作、DataFrame操作和spark.sql执行SQL语句实现以下数据分析: 总共有多少学生? 总共开设了多少门课程? 每个学生选修了多少门课? 每门课程有多少个学生选? 每门课程>95分的学生人数 课程'Python'有多少个100 阅读全文
posted @ 2022-05-26 22:54 cripple。 阅读(73) 评论(0) 推荐(0)
摘要:1.分析SparkSQL出现的原因,并简述SparkSQL的起源与发展。 随着Spark的发展,对于野心勃勃的Spark团队来说,Shark对于Hive的太多依赖(如采用Hive的语法解析器、查询优化器等等),制约了Spark的One Stack Rule Them All的既定方针,制约了Spar 阅读全文
posted @ 2022-05-07 08:59 cripple。 阅读(86) 评论(0) 推荐(0)