05 2022 档案
-
8. SparkSQL综合作业
摘要:综合练习:学生课程分数 网盘下载sc.txt文件,分别创建RDD、DataFrame和临时表/视图; # 创建RDD # 转换得到DataFrame # 观察 df # 注册为临时表 观察临时表 分别用RDD操作、DataFrame操作和spark.sql执行SQL语句实现以下数据分析: 1.总共有 阅读全文
-
7.Spark SQL
摘要:1.分析SparkSQL出现的原因,并简述SparkSQL的起源与发展。 SparkSQL出现的原因 hive是shark的前身,shark是sparkSQL的前身,sparkSQL产生的根本原因是其完全脱离了hive的限制,hive是hive SQL转换成MapReduce然后提交到集群上执行,大 阅读全文
浙公网安备 33010602011771号