2020 年 3月 22 日随笔档案 - Mr·Li程序员

2020年3月22日

摘要：

一、数据倾斜原因常见表现：在hive中 map阶段早就跑完了，reduce阶段一直卡在99%。很大情况是发生了数据倾斜，整个任务在等某个节点跑完。在spark中大部分的task执行的特别快，剩下的一些task执行的特别慢，要几分钟或几十分钟才执行完一个task Hive中大表join的时候，容易阅读全文

posted @ 2020-03-22 20:32 Mr·Li程序员阅读(399) 评论(0) 推荐(0)

公告