刘淑婷

05 2022 档案

8. SparkSQL综合作业
摘要:综合练习:学生课程分数 网盘下载sc.txt文件,分别用RDD操作、DataFrame操作和spark.sql执行SQL语句实现以下数据分析: 总共有多少学生? 总共开设了多少门课程? 每个学生选修了多少门课? 每门课程有多少个学生选? 每门课程>95分的学生人数 课程'Python'有多少个100 阅读全文

posted @ 2022-05-27 10:36 树亭 阅读(56) 评论(2) 推荐(0)

7.Spark SQL
摘要:1.分析SparkSQL出现的原因,并简述SparkSQL的起源与发展。 Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个叫作Data Frame的编程抽象结构数据模型(即带有Schema信息的RDD),Spark SQL作为分布式SQL查询引擎,让用户可以通过SQL、Dat 阅读全文

posted @ 2022-05-10 18:29 树亭 阅读(149) 评论(0) 推荐(0)

导航