2019年10月28日

大数据调优

摘要: 1.distrbute by rand()或者加表中字段 distribute by是控制在map端如何拆分数据给reduce端的。hive会根据distribute by后面列,对应reduce的个数进行分发,默认是采用hash算法 阅读全文
posted @ 2019-10-28 10:08 ~handsome 阅读(161) 评论(0) 推荐(0) 编辑