会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
钟心意
博客园
首页
新随笔
联系
订阅
管理
2021年10月8日
HIve数据倾斜优化
摘要: 数据倾斜解决 看下key的分布 处理集中的key 原因 1)、key分布不均匀(实际上还是重复) 比如 group by 或者 distinct的时候 2)、数据重复,join 笛卡尔积 数据膨胀 表现 任务进度长时间维持在99%(或100%),查看任务监控页面,发现只有少量(1个或几个)reduc
阅读全文
posted @ 2021-10-08 21:31 钟心意
阅读(61)
评论(0)
推荐(0)
公告