摘要: order by:会对输入做全局排序,因此只有一个reducer,会导致输入规模较大时,需要较长的计算时间 sort by:不是全局排序,其数据在进入reducer之前完成排序,只保证每个reducer的输出有序而不保证全局有序 distribute by:根据指定的字段将数据分到不同的reduce 阅读全文
posted @ 2020-08-26 08:27 Protect_Winter 阅读(425) 评论(0) 推荐(0)