2020年11月13日

摘要: 一 InputFormat主要作用: InputFormat抽象类仅有两个抽象方法:List<InputSplit> getSplits(), 获取由输入文件计算出输入分片(InputSplit),解决数据或文件分割成片问题。RecordReader<K,V> createRecordReader( 阅读全文
posted @ 2020-11-13 18:29 happygril3 阅读(182) 评论(0) 推荐(0)
摘要: 按照mapreduce编程规范,分别编写Mapper,Reducer,Driver。 (1)定义一个mapper类 package com.atguigu.wordCount; import org.apache.hadoop.io.IntWritable; import org.apache.ha 阅读全文
posted @ 2020-11-13 18:16 happygril3 阅读(95) 评论(0) 推荐(0)
摘要: 统计一堆文件中单词出现的个数(WordCount案例) (1)定义一个mapper类 package com.atguigu.wordCount; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWri 阅读全文
posted @ 2020-11-13 11:47 happygril3 阅读(82) 评论(0) 推荐(0)

导航