会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
挪威森林猫
花有重开日 人无再少年
博客园
首页
新随笔
联系
订阅
管理
2020年4月5日
Hive查询优化
摘要: 1.先过滤,再查询,因为每次生成中间表都会存储到Linux磁盘上 , 记住 , 不是HDFS 2.注意数据倾斜 , 倾斜的原因是reduce端数据的大量富集, 可适度增加reduce , 会着开启 Reduce自己判断 , 某一比较大 , 自己再分开点.也就是合理设置 reduce数量 hive.e
阅读全文
posted @ 2020-04-05 08:50 挪威森林猫Zzz
阅读(338)
评论(0)
推荐(0)
公告