会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
wang3680 机会是留给那些有准备的人
——呼和浩特市大学西路235号
博客园
首页
新随笔
联系
管理
2020年3月12日
holodesk表存储-列重复值太多,导致存储占用空间翻很多倍
摘要: holodesk为了权衡列式存储的解压带来的性能影响,采用的是行列式混合存储架构,这种架构再压缩列重复数据时会比单纯的列式存储架构的压缩比要小; orc表采用的列式压缩方式,对列重复数据具有很好的压缩性能,所以两种表类型对应的压缩格式不同,导致两种表在重复数据较多时占用的存储空间相差较大; 当然,这
阅读全文
posted @ 2020-03-12 10:16 Tim&Blog
阅读(859)
评论(0)
推荐(0)
编辑
公告