会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
chenzechao
博客园
首页
新随笔
联系
管理
订阅
2018年12月5日
hive表多种存储格式的文件大小差异,无重复数据
摘要: -- 重点,目标表无重复数据 从结果可以看出,在无重复数据的情况下,parquet的压缩无用武之地,占用空间比textfile还大,ORC是压缩最强的文件模式。
阅读全文
posted @ 2018-12-05 18:21 chenzechao
阅读(904)
评论(0)
推荐(0)
公告