会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
leesf
掌控之中,才会成功;掌控之外,注定失败。
博客园
首页
新随笔
联系
管理
2021年6月20日
通过Z-Order技术加速Hudi大规模数据集分析方案
摘要: 1. 背景 多维分析是大数据分析的一个典型场景,这种分析一般带有过滤条件。对于此类查询,尤其是在高基字段的过滤查询,理论上只我们对原始数据做合理的布局,结合相关过滤条件,查询引擎可以过滤掉大量不相关数据,只需读取很少部分需要的数据。例如我们在入库之前对相关字段做排序,这样生成的每个文件相关字段的mi
阅读全文
posted @ 2021-06-20 20:09 leesf
阅读(2207)
评论(0)
推荐(0)
编辑
公告