大数据数据倾斜的原因及解决办法
摘要:大数据数据倾斜的原因及解决办法 一、什么是数据倾斜 数据倾斜是指在分布式处理中,数据分布不均匀,有部分数据比较集中。数据倾斜会使得在处理过程中,某个节点的处理效率过低,甚至造成内存溢出。比如有1亿条性别数据,其中性别为男的数据有9900w,性别为女的有100w,处理的时候分到不同节点就容易造成数据倾
阅读全文
posted @ 2023-08-10 15:10
posted @ 2023-08-10 15:10
posted @ 2023-05-29 10:04
posted @ 2023-04-12 14:19
posted @ 2023-04-11 17:13