HDFS可插拔的业务逻辑处理

1、CaseIgnoreWordCountMapper.java

文件中的大小写默认是有区分。所以大小写分别记作一个单词。

此处将所有大写转变为小写:复制 WordCountMapper.java 为 CaseIgnoreWordCountMapper.java

将:

String[] words = line.split("\t");

改为:

String[] words = line.toLowerCase().split("\t");

 

posted @ 2021-07-07 09:41  酱汁怪兽  阅读(45)  评论(0)    收藏  举报