分区数量与reduce个数怎样才能不报错
reduce数量只能是1个或者比分区的数量多,否则数据写入会出现问题报错。
因为系统有自带的方法,也可以自定义,如果自定义就跑自定义的方法,是1就用系统默认的。
大于的时候会产生多个空的输出文件。(浪费内存和空间)
分区的数量应该连续。
reduce数量只能是1个或者比分区的数量多,否则数据写入会出现问题报错。
因为系统有自带的方法,也可以自定义,如果自定义就跑自定义的方法,是1就用系统默认的。
大于的时候会产生多个空的输出文件。(浪费内存和空间)
分区的数量应该连续。