摘要:
Hive 的执行原理基于将类 SQL(HQL)查询转换为分布式计算任务(如 MapReduce、Tez 或 Spark),并通过元数据管理实现数据与计算的解耦。 以下是其核心原理的详细分析: 一、Hive 执行流程 查询提交与解析 用户通过 CLI、JDBC 或 Web UI 提交 HQL 查询 阅读全文
posted @ 2025-04-27 16:53
业余砖家
阅读(134)
评论(0)
推荐(0)
摘要:
一、定位Hive慢任务的方法 1. 查看日志与执行计划 Hive日志:启用详细日志(hive -hiveconf hive.root.logger=DEBUG,console),检查任务执行阶段的耗时。 EXPLAIN命令:通过EXPLAIN [FORMATTED] <query>生 阅读全文
posted @ 2025-04-27 16:48
业余砖家
阅读(120)
评论(0)
推荐(0)

浙公网安备 33010602011771号