会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
murkey
博客园
首页
新随笔
联系
管理
订阅
04 2020 档案
分布式DB(Greenplum)中数据倾斜的原因和解法
摘要:背景 对于分布式数据库来说,QUERY的运行效率取决于最慢的那个节点。 当数据出现倾斜时,某些节点的运算量可能比其他节点大。除了带来运行慢的问题,还有其他的问题,例如导致OOM,或者DISK FULL等问题。如何监控倾斜1、 监控数据库级别倾斜2、 监控表级倾斜出现数据倾斜的原因和解决办法1、分布键选择不正确,导致数据存储分布不均。 例如选择的字段某些值特别多,由于数据是按分布键VA...
阅读全文
posted @
2020-04-15 11:14
murkey
阅读(1604)
评论(0)
推荐(0)
公告