摘要:
网盘下载sc.txt文件,分别创建RDD、DataFrame和临时表/视图; 分别用RDD操作、DataFrame操作和spark.sql执行SQL语句实现以下数据分析: 1.总共有多少学生? 2.总共开设了多少门课程? 3.每个学生选修了多少门课? 4.每门课程有多少个学生选? 5.每门课程>95 阅读全文
posted @ 2022-05-30 09:55
球球不会转
阅读(33)
评论(0)
推荐(0)
摘要:
7.Spark SQL 1.分析SparkSQL出现的原因,并简述SparkSQL的起源与发展。 SparkSQL出现的原因 hive是shark的前身,shark是sparkSQL的前身,sparkSQL产生的根本原因是其完全脱离了hive的限制,hive是hive SQL转换成MapReduce 阅读全文
posted @ 2022-05-11 17:54
球球不会转
阅读(63)
评论(0)
推荐(0)
浙公网安备 33010602011771号