摘要:
1. SparkSQL 和 Hive同样,都是用于大规模SQL分布式计算的计算框 架,均可以运行在YARN之上,在企业中广泛被应用 2. SparkSQL的数据抽象为:SchemaRDD(废弃)、DataFrame( Python、R、Java、Scala)、DataSet(Java、Scala)。 阅读全文
posted @ 2024-01-26 22:13
椰糖
阅读(13)
评论(0)
推荐(0)
|
摘要:
1. SparkSQL 和 Hive同样,都是用于大规模SQL分布式计算的计算框 架,均可以运行在YARN之上,在企业中广泛被应用 2. SparkSQL的数据抽象为:SchemaRDD(废弃)、DataFrame( Python、R、Java、Scala)、DataSet(Java、Scala)。 阅读全文
posted @ 2024-01-26 22:13
椰糖
阅读(13)
评论(0)
推荐(0)
|