posted @ 2021-09-05 17:46 天戈朱 阅读(1293) 评论(0) 推荐(0) 编辑
摘要:
Colocation Join 是在 Doris 0.9 版本中引入的新功能。旨在为某些 Join 查询提供本地性优化,来减少数据在节点间的传输耗时,加速查询。 1、基本理论 Join 的常见连接类型分为以下几种: INNER JOIN OUTER JOIN CROSS JOIN SEMI JOIN 阅读全文
摘要:
DorisDB提供了多种导入方式,用户可以根据数据量大小、导入频率等要求选择最适合自己业务需求的导入方式。 数据导入: 1、离线数据导入:如果数据源是Hive/HDFS,推荐采用 Broker Load 导入, 如果数据表很多导入比较麻烦可以考虑使用Hive外表直连查询,性能会比Broker loa 阅读全文
posted @ 2021-09-05 17:46 天戈朱 阅读(5198) 评论(0) 推荐(0) 编辑
摘要:
目录: 数据查询 数据导入 元数据修改 1、查询 用户可使用MySQL客户端连接FE,执行SQL查询, 获得结果,查询流程如下: 分步说明: ① MySQL客户端执行DQL SQL命令。 ② FE解析, 分析, 改写, 优化和规划, 生成分布式执行计划。 ③ 分布式执行计划由 若干个可在单台be上执 阅读全文
posted @ 2021-09-05 17:45 天戈朱 阅读(517) 评论(0) 推荐(0) 编辑
摘要:
在 Doris 中,数据都以表(Table)的形式进行逻辑上的描述 名词解释 数据分布:数据分布是将数据划分为子集, 按一定规则, 均衡地分布在不同节点上,以期最大限度地利用集群的并发性能 短查询:short-scan query,指扫描数据量不大,单机就能完成扫描的查询 长查询:long-scan 阅读全文
posted @ 2021-09-05 17:44 天戈朱 阅读(3216) 评论(0) 推荐(1) 编辑
摘要:
使用场景: 在实际的业务场景中,通常存在两种场景并存的分析需求:对固定维度的聚合分析 和 对原始明细数据任意维度的分析。 例如,在销售场景中,每条订单数据包含这几个维度信息(item_id, sold_time, customer_id, price)。在这种场景下,有两种分析需求并存: 业务方需要 阅读全文
posted @ 2021-07-26 08:27 天戈朱 阅读(3031) 评论(0) 推荐(1) 编辑