博客园  :: 首页  :: 联系 :: 管理
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 34 下一页

2021年9月5日

摘要: Colocation Join 是在 Doris 0.9 版本中引入的新功能。旨在为某些 Join 查询提供本地性优化,来减少数据在节点间的传输耗时,加速查询。 1、基本理论 Join 的常见连接类型分为以下几种: INNER JOIN OUTER JOIN CROSS JOIN SEMI JOIN 阅读全文

posted @ 2021-09-05 17:46 天戈朱 阅读(1293) 评论(0) 推荐(0) 编辑

摘要: DorisDB提供了多种导入方式,用户可以根据数据量大小、导入频率等要求选择最适合自己业务需求的导入方式。 数据导入: 1、离线数据导入:如果数据源是Hive/HDFS,推荐采用 Broker Load 导入, 如果数据表很多导入比较麻烦可以考虑使用Hive外表直连查询,性能会比Broker loa 阅读全文

posted @ 2021-09-05 17:46 天戈朱 阅读(5198) 评论(0) 推荐(0) 编辑

摘要: 目录: 数据查询 数据导入 元数据修改 1、查询 用户可使用MySQL客户端连接FE,执行SQL查询, 获得结果,查询流程如下: 分步说明: ① MySQL客户端执行DQL SQL命令。 ② FE解析, 分析, 改写, 优化和规划, 生成分布式执行计划。 ③ 分布式执行计划由 若干个可在单台be上执 阅读全文

posted @ 2021-09-05 17:45 天戈朱 阅读(517) 评论(0) 推荐(0) 编辑

摘要: 在 Doris 中,数据都以表(Table)的形式进行逻辑上的描述 名词解释 数据分布:数据分布是将数据划分为子集, 按一定规则, 均衡地分布在不同节点上,以期最大限度地利用集群的并发性能 短查询:short-scan query,指扫描数据量不大,单机就能完成扫描的查询 长查询:long-scan 阅读全文

posted @ 2021-09-05 17:44 天戈朱 阅读(3216) 评论(0) 推荐(1) 编辑

2021年9月2日

该文被密码保护。 阅读全文

posted @ 2021-09-02 11:56 天戈朱 阅读(1) 评论(0) 推荐(0) 编辑

2021年8月1日

该文被密码保护。 阅读全文

posted @ 2021-08-01 18:17 天戈朱 阅读(2) 评论(0) 推荐(0) 编辑

该文被密码保护。 阅读全文

posted @ 2021-08-01 17:09 天戈朱 阅读(0) 评论(0) 推荐(0) 编辑

该文被密码保护。 阅读全文

posted @ 2021-08-01 17:09 天戈朱 阅读(1) 评论(0) 推荐(0) 编辑

2021年7月26日

摘要: 使用场景: 在实际的业务场景中,通常存在两种场景并存的分析需求:对固定维度的聚合分析 和 对原始明细数据任意维度的分析。 例如,在销售场景中,每条订单数据包含这几个维度信息(item_id, sold_time, customer_id, price)。在这种场景下,有两种分析需求并存: 业务方需要 阅读全文

posted @ 2021-07-26 08:27 天戈朱 阅读(3031) 评论(0) 推荐(1) 编辑

摘要: DorisDB根据摄入数据和实际存储数据之间的映射关系, 将数据表的明细表, 聚合表和更新表, 分别对应有明细模型, 聚合模型和更新模型。 Aggregate (聚合模型) : 将表中的列分为了Key和Value两种,数据会根据维度列进行分组,并对指标列进行聚合。 Unique (唯一主键模型): 阅读全文

posted @ 2021-07-26 08:24 天戈朱 阅读(3172) 评论(0) 推荐(1) 编辑

上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 34 下一页