摘要:一、对于数据倾斜的发生一般都是一个key对应的数据过大,而导致Task执行过慢,或者内存溢出(OOM),一般是发生在shuffle的时候,比如reduceByKey,groupByKey,sortByKey等,容易产生数据倾斜。 那么针对数据倾斜我们如何解决呢?我们可以首先观看log日志,以为log
阅读全文
posted @ 2018-11-14 13:30
posted @ 2018-11-14 13:30
posted @ 2018-11-14 10:58
posted @ 2018-11-14 10:44
posted @ 2018-11-02 19:13