摘要: hadoop的map/reduce中支持对key进行分区,从而让map出来的数据均匀分布在reduce上,当然,有时候由于机器间配置问题,可能不需要数据均匀,这时候也能派上用场。框架自带了一个默认的分区类,HashPartitioner,先看看这个类,就知道怎么自定义key分区了。public cl... 阅读全文
posted @ 2015-08-22 09:51 淡淡的忧伤IT男 阅读(1192) 评论(0) 推荐(0)