摘要: 一、InputFormat 数据输入 1. 数据块:Block是HDFS上将文件分割成为物理块 2. 数据切片:逻辑上对数据进行分片 3. 数据切片与MapTask并行度决定机制 1)一个Job的并行度是由谁决定?? 由数据切片数目决定 2)每一个split切片会分到一个MapTask上运行。 3) 阅读全文
posted @ 2019-09-24 09:38 guoqiangliu 阅读(181) 评论(0) 推荐(0)