摘要: 1. 概述 ==Spark SQL是Spark用于结构化数据(structured data)处理的Spark模块== 1.1 历史 Hive是早期唯一运行在Hadoop上的SQL-on-Hadoop工具。但是MapReduce计算过程中大量的中间磁盘落地过程消耗了大量的I/O,降低的运行效率,为了 阅读全文
posted @ 2022-12-07 15:35 黄一洋 阅读(19) 评论(0) 推荐(0)