摘要: 介绍 目的 Chaneglog producer 的主要目的是为了在 Paimon 表上产生流读的 changelog, 所以如果只是批读的表是可以不用设置 Chaneglog producer 的. 一般对于数据库如 MySQL 来说, 当执行的语句涉及数据的修改例如插入、更新、删除时,MySQL 阅读全文
posted @ 2023-12-17 14:01 血染河山 阅读(692) 评论(0) 推荐(0) 编辑
摘要: - 这两周从听 #纵横四海 播客 #刻意练习 和笔记的力量开始逐渐关注到双链笔记, 其实最早在听ByteTalk的时候就有听到一期嘉宾介绍到一款双链笔记 #logseq . 其实给我印象最深的是刻意练习中关于对学习的讲解, 其中提到刻意练习最重要的几部分: chunk 和 link. 而双链笔记 最 阅读全文
posted @ 2023-08-12 19:40 血染河山 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 类型有什么作用, 类型可以提供编译期检查, 避免到运行期才报错. # 类型 首先Flink中自己定义了一套类型, 有`LogicalType`和`DataType`两个表示 ## LogicalType `LogicalType`表示的逻辑类型, 并不涉及类型的物理表示, 会包含nullable属性 阅读全文
posted @ 2023-08-05 00:21 血染河山 阅读(615) 评论(0) 推荐(0) 编辑
摘要: # 二叉堆 二叉堆具有两个性质, 结构性和排序性. ## 结构性质 堆是一棵除了底层以外都被完全填满的二叉树, 叫做完全二叉树, 而最底层从左到右都是满的, 右侧允许有空缺 ![image.png](https://cdn.nlark.com/yuque/0/2023/png/492896/1690 阅读全文
posted @ 2023-07-24 00:45 血染河山 阅读(200) 评论(0) 推荐(1) 编辑
摘要: # 机制 链表中查询的效率的复杂度是O(n), 有没有办法提升这个查询复杂度呢? 最简单的想法就是在原始的链表上构建多层索引. ![image.png](https://img2023.cnblogs.com/blog/697236/202307/697236-20230723151642781-1 阅读全文
posted @ 2023-07-23 00:37 血染河山 阅读(172) 评论(0) 推荐(1) 编辑
摘要: 在Delta Lake官网上提到的一篇新一代湖仓架构的论文. 这篇论文由Databricks团队2021年发表于CIDR会议. 这个会议是对sigmod和vldb会议的补充. 可以看到这篇论文和前一篇Delta Lake: High-Performance ACID Table Storage ov 阅读全文
posted @ 2023-07-15 21:40 血染河山 阅读(147) 评论(0) 推荐(0) 编辑
摘要: 论文发表于 2020年, 研究数据湖产品的很好的学习资料. # 概要 开篇很明确的表明了为什么要做Delta lake这样一个产品. Databricks尝试将数据仓库直接架在云上对象存储之上, 这种尝试的过程中遇到了对象存储的一些问题, 为了解决这些问题, 提出了Delta lake这套技术方案. 阅读全文
posted @ 2023-07-13 23:07 血染河山 阅读(173) 评论(0) 推荐(0) 编辑
摘要: Compact主要涉及以下几个组件 CompactManager 管理Compact task CompactRewriter 用于compact过程中数据的重写实现, 比如compact过程中产生changelog等 CompactStrategy 决定哪些文件需要被compact Append 阅读全文
posted @ 2023-06-26 17:08 血染河山 阅读(776) 评论(0) 推荐(0) 编辑
摘要: # 查询模式 先来看看官网关于Paimon查询模式的说明 ![image.png](https://img2023.cnblogs.com/blog/697236/202306/697236-20230625192823219-2121282029.png) ![image.png](https:/ 阅读全文
posted @ 2023-06-25 19:29 血染河山 阅读(962) 评论(0) 推荐(0) 编辑
摘要: > 基于Paimon 0.5版本 写入流程的构建`org.apache.paimon.flink.sink.FlinkSinkBuilder#build` 算子的流向 BucketingStreamPartitioner 分区 -> RowDataStoreWriteOperator 写入 -> C 阅读全文
posted @ 2023-06-23 21:16 血染河山 阅读(919) 评论(0) 推荐(0) 编辑