摘要:
1、map通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有: input的文件总个数,input的文件大小;假设input目录下有1个文件a,大小为780M,那么hadoop会将该文件a分隔成7个块(6个128m的块和1个12m的块),从而产生7个map数;假设input目录下有3个文件a,b,c,大小分别为10m,20m,130m,那么hadoop会分隔成4个... 阅读全文
posted @ 2019-09-06 15:49
米兰的小铁將
阅读(592)
评论(0)
推荐(0)

浙公网安备 33010602011771号