会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
lowreed
博客园
首页
新随笔
联系
订阅
管理
2024年5月26日
spark数据倾斜
摘要: 数据倾斜七种解决方案 使用Hive ETL预处理数据 过滤少数导致倾斜的key 提高shuffle操作的并行度(分区) 双重聚合 将reduce join转为map join 采样倾斜key并分拆join操作 使用随机前缀和扩容RDD进行join 1、使用Hive ETL预处理数据 方案适用场景:如
阅读全文
posted @ 2024-05-26 19:47 low-reed
阅读(74)
评论(0)
推荐(0)
公告