会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Aitozi's的博客
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
下一页
2023年7月13日
Delta Lake: High-Performance ACID Table Storage over Cloud Object Stores
摘要: 论文发表于 2020年, 研究数据湖产品的很好的学习资料. # 概要 开篇很明确的表明了为什么要做Delta lake这样一个产品. Databricks尝试将数据仓库直接架在云上对象存储之上, 这种尝试的过程中遇到了对象存储的一些问题, 为了解决这些问题, 提出了Delta lake这套技术方案.
阅读全文
posted @ 2023-07-13 23:07 Aitozi
阅读(417)
评论(0)
推荐(1)
2023年6月26日
Paimon Compaction实现
摘要: Compact主要涉及以下几个组件 CompactManager 管理Compact task CompactRewriter 用于compact过程中数据的重写实现, 比如compact过程中产生changelog等 CompactStrategy 决定哪些文件需要被compact Append
阅读全文
posted @ 2023-06-26 17:08 Aitozi
阅读(2363)
评论(2)
推荐(1)
2023年6月25日
Paimon读取流程
摘要: # 查询模式 先来看看官网关于Paimon查询模式的说明  
评论(0)
推荐(1)
2023年6月23日
Paimon的写入流程
摘要: > 基于Paimon 0.5版本 写入流程的构建`org.apache.paimon.flink.sink.FlinkSinkBuilder#build` 算子的流向 BucketingStreamPartitioner 分区 -> RowDataStoreWriteOperator 写入 -> C
阅读全文
posted @ 2023-06-23 21:16 Aitozi
阅读(2297)
评论(0)
推荐(0)
2023年6月17日
Calcite sql2rel 过程
摘要: sql2rel的过程是将SqlNode 转化成RelNode的过程 在 `SqlToRelConverterTest`中添加样例测试 ```java @Test void testScan() { String sql = "SELECT * FROM EMP WHERE empno When va
阅读全文
posted @ 2023-06-17 17:43 Aitozi
阅读(437)
评论(0)
推荐(1)
2023年5月23日
用rust 写一个jar包 class冲突检测工具
摘要: Rust很适合写命令行工具,特别是使用`clap` crate 更加方便,这篇文章介绍使用rust写一个jar包class冲突检测的工具。项目地址: [https://github.com/Aitozi/jar_conflict_detector](https://github.com/Aitozi
阅读全文
posted @ 2023-05-23 23:27 Aitozi
阅读(473)
评论(0)
推荐(1)
2023年5月16日
rust 中 str 与 String; &str &String
摘要: String String 类型的数据和基本类型不同,基本类型的长度是固定的,所以可以在栈上分配,而String类型是变长的,所以需要在堆上分配,所以String 类型实际上是一个指向堆的指针。他的结构和Vec很类似。从他的声明看也是一个u8的Vec pub struct String { vec:
阅读全文
posted @ 2023-05-16 21:34 Aitozi
阅读(957)
评论(0)
推荐(2)
2023年5月7日
好奇心: 保持对未知世界用不停息的热情
摘要: 2023 第三本书,之前下决心每次读完书就要写一篇读后感,加深认识。结果下决心后的第一本 《乡土中国》就写不下来读后感,感觉读后感太多太密,还不如想起来的时候回头浏览一遍书。 但是最近听路障的视频,发现他也建议写读后感来增加对书的认识,这样能更好的帮助记忆,加上这本书好奇心里面的观点,创造力来源于知
阅读全文
posted @ 2023-05-07 22:23 Aitozi
阅读(122)
评论(0)
推荐(0)
2023年5月5日
Apache hudi 核心功能点分析
摘要: Hudi 文中部分代码对应 0.14.0 版本 发展背景 初始的需求是Uber公司会有很多记录级别的更新场景,Hudi 在Uber 内部主要的一个场景,就是乘客打车下单和司机接单的匹配,乘客和司机分别是两条数据流,通过 Hudi 的 Upsert 能力和增量读取功能,可以分钟级地将这两条数据流进行拼
阅读全文
posted @ 2023-05-05 11:12 Aitozi
阅读(890)
评论(0)
推荐(1)
2023年3月10日
Scala集合flatten操作
摘要: 一层嵌套,但是flatten的要求需要List内部类型都一样, 例如都为List scala> List(List(1), List(2), List(3)).flatten res4: List[Int] = List(1, 2, 3) scala> List(List(List(1)), Lis
阅读全文
posted @ 2023-03-10 23:10 Aitozi
阅读(141)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
下一页
公告