Hadoop中的分区Partitioner???

参考 https://www.cnblogs.com/edisonchou/p/4297828.html

Hadoop中分区,如果不指定的话,他会使用自带的HashPartitioner

如果你业务中有需求,需要使用分区来查看文件的时候,就需要自己定义分区来使用

例如上图,需要统计手机号码的信息,就需要剔除电话号码时???

那你就需要自定义两个分区?

这时候,结果就会分为两个文件。

也许这就是 分区吧 兄die

 

posted @ 2019-08-13 16:46  某年某月某某人  阅读(135)  评论(0)    收藏  举报