HDFS可插拔的业务逻辑处理
1、CaseIgnoreWordCountMapper.java
文件中的大小写默认是有区分。所以大小写分别记作一个单词。
此处将所有大写转变为小写:复制 WordCountMapper.java 为 CaseIgnoreWordCountMapper.java
将:
String[] words = line.split("\t");
改为:
String[] words = line.toLowerCase().split("\t");

1、CaseIgnoreWordCountMapper.java
文件中的大小写默认是有区分。所以大小写分别记作一个单词。
此处将所有大写转变为小写:复制 WordCountMapper.java 为 CaseIgnoreWordCountMapper.java
将:
String[] words = line.split("\t");
改为:
String[] words = line.toLowerCase().split("\t");
