摘要: 数据倾斜解决 看下key的分布 处理集中的key 原因 1)、key分布不均匀(实际上还是重复) 比如 group by 或者 distinct的时候 2)、数据重复,join 笛卡尔积 数据膨胀 表现 任务进度长时间维持在99%(或100%),查看任务监控页面,发现只有少量(1个或几个)reduc 阅读全文
posted @ 2021-10-08 21:31 钟心意 阅读(61) 评论(0) 推荐(0)