随笔档案「2020年11月7日」：hadoop解决数据倾斜方法 ... - 北冥_之鱼

2020年11月7日

摘要： 1）提请在map端进行combiner,减少传入的数据量在mapper加上combiner相当于提前进行reduce，即把一个Mappper中的相同key进行了聚合，减少shuffle过程中传输数据量，以及reducer端的计算量。【注意：map端的提前聚合不能影响最终的结果，eg:求平均值的就不阅读全文

posted @ 2020-11-07 09:39 北冥_之鱼阅读(166) 评论(0) 推荐(0)

代码工匠

公告