摘要:
数据倾斜是在做计算的时候数据分配不均匀导致,数据分配不均有可能发生在: 1.join列 问题根源: SELECT COUNT(*) FROM orders o JOIN customer c ON o.customer_number = c.customer_number; 比如某个customer 阅读全文
posted @ 2025-12-08 15:59
秋水依然
阅读(7)
评论(0)
推荐(0)
摘要:
一、建表 1.1 Doris 支持 Duplicate、Unique、Aggregate 三种表模型,这几种表模型的查询性能,由好到差依次为:Duplicate > MOW > MOR == Aggregate。 1.2 分桶列:选择高基数的列,避免数据倾斜(如果一列不够,可以选择多列,这样可以把数 阅读全文
posted @ 2025-12-08 14:14
秋水依然
阅读(3)
评论(0)
推荐(0)
摘要:
一、什么是物化视图 和普通的视图不一样,物化视图不仅生成视图而且能存储数据,本质是一张MTMV的内表,创建一个定时任务将数据写入,它的表结构由SQL推导生成不支持修改 二、使用场景 实时报表查询、数据分层(ODS >DWD >DWS)、湖仓一体(物化外部数据源,加速查询) 三、分类 根据存储时效分为 阅读全文
posted @ 2025-12-08 09:47
秋水依然
阅读(17)
评论(0)
推荐(0)
浙公网安备 33010602011771号