摘要: 排序 全局排序(Order by) 对整个输出结果集进行排序,只会产生一个Reduce 每个Reduce内部排序(Sort by) Sort By:对于大规模的数据集order by的效率非常低。在很多情况下,并不需要全局排序,此时可以使用sort by。 Sort by为每个reducer产生一个 阅读全文
posted @ 2020-12-01 19:50 Later^^ 阅读(860) 评论(0) 推荐(0)