重点概念:

输入分片:在进行map计算之前,mapreduce会根据数据文件计算输入的分片(input split)。

每个输入分片针对一个map任务,输入分片存储的并非数据本身,而是一个分片长度和一个记录数据的位置的数组。   [而 实时ctr代码中,直接取列表的第1个,来做判断,所以出错。]???