摘要:
问题: presto查询的Hive表,发现 :增量表的查询时间区间取的是数仓表的分区dt,取最大和最小dt的时候,Trino会全表扫描hive表,无效计算而且特别慢。 全量表的话,每天的分区里都是分区当天及以前的数据;查询默认限定在最新的分区。 增量表的话每天的分区只有分区当天的数据;查询要根据时间 阅读全文
posted @ 2023-05-24 21:10
LUDAGOGO
阅读(797)
评论(0)
推荐(0)
摘要:
了解hive内表与外表并应用 1、内外表基础介绍 Hive是建立在Hadoop之上的数据仓库工具,它提供了类似于SQL的查询语言(HiveQL),可以方便地进行数据分析和处理。在Hive中,你可以创建内部表(Internal Table)和外部表(External Table)来管理数据。下面是内部 阅读全文
posted @ 2023-05-24 18:58
LUDAGOGO
阅读(4514)
评论(0)
推荐(0)

浙公网安备 33010602011771号