会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
HANIEEE
CnBlogs
Home
New Post
Contact
Admin
Subscription
2022年4月14日
SQL优化:distribute by 小数据场景处理数据倾斜
distribute by rand() distribute by :用来控制map输出结果的分发,即map端如何拆分数据给reduce端。 会根据distribute by 后边定义的列,根据reduce的个数进行数据分发,默认是采用hash算法。 使用方法:直接在sql结尾处加上 distri
Read More
posted @ 2022-04-14 16:13 HANIEEE
Views(586)
Comments(0)
Diggs(0)
Edit
公告