随笔档案「2014年4月16日」：Hadoop InputFormat浅析 ... - pingh14

公告

2014年4月16日

摘要：在执行一个Job的时候，Hadoop会将输入数据划分成N个Split，然后启动相应的N个Map程序来分别处理它们。数据如何划分？Split如何调度（如何决定处理Split的Map程序应该运行在哪台TaskTracker机器上）？划分后的数据又如何读取？这就是本文所要讨论的问题。先从一张经典的MapR... 阅读全文

posted @ 2014-04-16 22:32 pingh14 阅读(161) 评论(0) 推荐(0)