MapReduce当中什么叫数据倾斜(data skew)?

马克-to-win @ 马克java社区:什么叫数据倾斜(data skew)?假如,你有两个reduce节点,数据都跑到第一个节点,(比如p_id=p1的数据非常多)第二个节点没什么数据, 结果第一个节点,工作完成总是卡在99.99%,一直99.99%不能结束。

更多内容请见原文,文章转载自:https://blog.csdn.net/qq_44594249/article/details/97542408

posted @ 2021-11-05 18:05  小龙虾1  阅读(59)  评论(0)    收藏  举报