05 2022 档案
摘要:综合练习:学生课程分数 网盘下载sc.txt文件,分别创建RDD、DataFrame和临时表/视图; 分别用RDD操作、DataFrame操作和spark.sql执行SQL语句实现以下数据分析: 总共有多少学生? 总共开设了多少门课程? 每个学生选修了多少门课? 每门课程有多少个学生选? 每门课程>
阅读全文
摘要:1.分析SparkSQL出现的原因,并简述SparkSQL的起源与发展 SparkSQL出现的原因 Spark SQL 抛弃原有 Spark 的架构方式,但汲取了 Spark 的一些优点,如内存列存储( In-Memory Columnar Storage )、 Hive 兼容性等,重新开发了 SQ
阅读全文
浙公网安备 33010602011771号