摘要:
Hadoop 1. InputFormat(抽象类) 数据输入 1.2.1 FileInputFormat 1. 切片方法 1.1 抽象方法 1. public abstract List<InputSplit> getSplits (JobContext context) 2. public ab 阅读全文
posted @ 2021-12-19 23:10
学而不思则罔!
阅读(104)
评论(0)
推荐(0)
摘要:
Hadoop 2. InputSplit 切片类 1.0 类的作用 InputSplit 他在逻辑上包含了提供给处理这个Inputsplit的Mapper的所有的key-value 1.1 抽象方法 1. public abstract long getLength() 2. public abst 阅读全文
posted @ 2021-12-19 22:39
学而不思则罔!
阅读(168)
评论(0)
推荐(0)
摘要:
Hadoop 3. 切片 与 MapTask并行度 1. MapTask并行度 切片数 = MapTask 任务数(并行度) 0 . 术语 1. 数据块(Block) 2. 数据切片(Split) 1. Block是 HDFS物理上把数据文件分成一块一块 1. 数据切片只是在 逻辑上对输入数据进行分 阅读全文
posted @ 2021-12-19 17:53
学而不思则罔!
阅读(51)
评论(0)
推荐(0)

浙公网安备 33010602011771号