会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
leesf
掌控之中,才会成功;掌控之外,注定失败。
博客园
首页
新随笔
联系
管理
2022年7月18日
Apache Hudi数据跳过技术加速查询高达50倍
摘要: 介绍 在 Hudi 0.10 中,我们引入了对高级数据布局优化技术的支持,例如 Z-order和希尔伯特空间填充曲线(作为新的聚类算法),即使在经常使用过滤器查询大表的复杂场景中,也可以在多个列而非单个列上进行数据跳过。 但实际上什么是Data Skipping数据跳过? 随着存储在数据湖中的数据规
阅读全文
posted @ 2022-07-18 22:09 leesf
阅读(803)
评论(0)
推荐(1)
编辑
公告