摘要:
1.请分析SparkSQL出现的原因,并简述SparkSQL的起源与发展。 关系数据库在大数据时代已经不能满足要求 首先,用户需要从不同数据源执行各种操作,包括结构化、半结构化和非结构化数据 其次,用户需要执行高级分析,比如机器学习和图像处理 在实际大数据应用中,经常需要融合关系查询和复杂分析算法( 阅读全文
posted @ 2022-04-24 14:48
箫碧栽植
阅读(72)
评论(0)
推荐(0)
摘要:
集合运算练习 union(), intersection(),subtract(), cartesian() rdd1=sc.parallelize('abcd') rdd2=sc.parallelize('bcde') rdd1.union(rdd2).collect() rdd1.interse 阅读全文
posted @ 2022-04-24 14:16
箫碧栽植
阅读(33)
评论(0)
推荐(0)