上一页 1 2 3 4 5 6 7 ··· 46 下一页
摘要: Trino(以前称为PrestoSQL)是一个分布式 SQL 查询引擎,用于在大规模数据存储中执行交互式查询。以下是 Trino 的核心优势和一些原理: Trino 的核心优势: 分布式查询: Trino支持将查询分发到底层数据存储的多个节点上,从而实现高效的分布式查询。这使得Trino非常适合处理 阅读全文
posted @ 2024-01-07 11:15 guoyu1 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 字节跳动基于 Hudi 的实时数据湖平台 https://developer.volcengine.com/articles/7220345269954003004 数仓实时化改造:Hudi on Flink 在顺丰的实践应用 https://www.logclub.com/articleInfo/ 阅读全文
posted @ 2024-01-05 23:36 guoyu1 阅读(23) 评论(0) 推荐(0) 编辑
摘要: https://bbs.huaweicloud.com/blogs/282421 阅读全文
posted @ 2024-01-05 22:20 guoyu1 阅读(7) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/miketwais/articles/data_lakehouse.html 数仓:存储结构化数据,基于指标需求,面向主题组织数据,协助经营者进行决策; 数据湖:存储结构化,半结构化,非结构化,二进制数据,强调的是对于原始数据的存储,保留数据的完整性。 阅读全文
posted @ 2024-01-05 21:50 guoyu1 阅读(16) 评论(0) 推荐(0) 编辑
摘要: https://open.alipay.com/portal/forum/post/125601095 阅读全文
posted @ 2024-01-05 13:13 guoyu1 阅读(2) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/nishuiaee/article/details/109016702 。。。 public class Printer { public static class PrinterThread extends Thread { static boolean 阅读全文
posted @ 2024-01-04 19:40 guoyu1 阅读(2) 评论(0) 推荐(0) 编辑
摘要: https://www.zhihu.com/question/27125796 简单工厂 : 用来生产同一等级结构中的任意产品。(对于增加新的产品,主要是新增产品,就要修改工厂类。符合单一职责原则。不符合开放-封闭原则) 工厂方法 :用来生产同一等级结构中的固定产品。(支持增加任意产品,新增产品时不 阅读全文
posted @ 2024-01-03 12:09 guoyu1 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 一条查询 SQL 在关系型分布式数据库中的处理,通常需要经过 3 大步骤: 1. 将 SQL 文本转换成一个 “最佳的”分布式物理执行计划 2. 将执行计划调度到计算节点 3. 计算节点执行具体的物理执行计划 本文将详细解释在 StarRocks 中如何完成一条查询 SQL 的处理。 首先来了解 S 阅读全文
posted @ 2024-01-01 18:55 guoyu1 阅读(191) 评论(0) 推荐(0) 编辑
摘要: http://www.jasongj.com/spark/skew/ 阅读全文
posted @ 2023-12-31 12:39 guoyu1 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 1、Spark SQL / Catalyst 内部原理 与 RBO http://www.jasongj.com/spark/rbo/ 2、Spark SQL 性能优化再进一步 CBO 基于代价的优化 http://www.jasongj.com/spark/cbo/ 阅读全文
posted @ 2023-12-31 11:58 guoyu1 阅读(17) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 46 下一页