随笔分类 -  Hive调优

Hive调优系列文章
摘要:要理解相关子查询和非相关子查询,我们得首先理解什么是子查询,子查询是指在一个查询语句中嵌套的另一个查询语句。 阅读全文
posted @ 2024-04-28 16:35 鲁边 阅读(1350) 评论(0) 推荐(1)
摘要:我们讨论面试中各大厂的SQL算法面试题,往往核心考点就在于窗口函数,所以掌握好了窗口函数,面对SQL算法面试往往事半功倍。 阅读全文
posted @ 2024-04-13 22:20 鲁边 阅读(622) 评论(0) 推荐(0)
摘要:使用高级分组聚合不仅可以简化SQL语句,而且通常情况下会提升SQL语句的性能。 阅读全文
posted @ 2023-06-29 17:29 鲁边 阅读(995) 评论(0) 推荐(0)
摘要:带聚合函数的SQL逻辑,我们可以根据其执行过程的不同,将其分成三大类来进行分析: 仅在Reduce阶段聚合的SQL执行逻辑 在Map和Reduce阶段都有聚合操作的SQL执行逻辑 高级分组聚合的执行SQL逻辑 阅读全文
posted @ 2023-06-21 11:32 鲁边 阅读(680) 评论(0) 推荐(0)
摘要:hive本身提供的时间函数已经很丰富了,基本上能满足我们所有的需求,一些特殊需求也可以通过增加一些数学逻辑实现出来。 阅读全文
posted @ 2023-06-14 17:40 鲁边 阅读(3120) 评论(0) 推荐(0)
摘要:这种只含map的操作,如果文件大小控制在合适的情况下,都将只有本地操作,其执行非常高效,运行效率完全不输于在计算引擎Tez和Spark上运行。 阅读全文
posted @ 2023-06-13 17:26 鲁边 阅读(438) 评论(0) 推荐(0)
摘要:Hive开启向量化模式也是hiveSQL优化方法中的一种,可以提升hive查询速率,也叫hive矢量化。 阅读全文
posted @ 2023-06-09 20:14 鲁边 阅读(1179) 评论(2) 推荐(1)
摘要:如何在hiveSQL执行之前就探查到这段逻辑的血缘依赖关系? 阅读全文
posted @ 2023-06-07 20:43 鲁边 阅读(656) 评论(2) 推荐(0)
摘要:如果说Hive优化是一堵技术路上的高墙,那么关于Hive执行计划,就是爬上这堵高墙的一架梯子。 阅读全文
posted @ 2023-06-06 19:55 鲁边 阅读(1761) 评论(0) 推荐(0)
摘要:HiveSql调优系列之Hive严格模式,如何合理使用Hive严格模式所谓Hive的严格模式,就是为了避免用户提交一些恶意SQL,消耗大量资源进而使得运行环境崩溃做出的一些安全性的限制。 阅读全文
posted @ 2022-09-02 18:51 鲁边 阅读(2300) 评论(0) 推荐(0)