会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
atao-BigData
人生如逆旅,你我亦行人。
博客园
首页
新随笔
联系
订阅
管理
spark-数据倾斜
spark-数据倾斜
1.解决方案
1.1使用Hive ETL预处理数据
1.2、过滤少数导致倾斜的key
1.3、提高shuffle操作的并行度
1.4、双重聚合
1.5、将reduce join转为map join
1.6 、采样倾斜key并分拆join操作
1. 7、使用随机前缀和扩容RDD进行join
posted @
2022-07-21 23:17
a-tao必须奥利给
阅读(
49
) 评论(
0
)
收藏
举报
刷新页面
返回顶部
公告