PhoneBean实体类的封装和map输出键值对的设置
之前我们写好了bean类型。现在我们再看看这个需求中,map和reduce各自的流程。
Map阶段:
字段切分以后保留如下字段:以第一行为例,就保留13726230503112 2481 24681 字段
将数据封装到PhoneBean里面
将手机号设置成keyout
将PhoneBean设置成valueout
Reduce阶段:
reduce阶段自动将相同手机号的数据聚合
map(
key (手机号):13726230503112
value(实体类):{
phoneNumber:13726230503112
upflow:2481
downflow:24681
}
)
然后key值相同(同一个手机号)的数据放到一起,统计上行流量总和,下行流量总和,总流量和,
keyout:手机号
valueout:PhoneBean对象
这样我们就能以手机号为key值,一个实体类为value的键值对输出结果。
新建一个FlowMapper类,我们在这个类中封装phonebean和设置map阶段的keyout,valueout值
代码如下:
package MR.phone;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
import java.io.IOException;
//map阶段valueout是一个实体类
public class FlowMapper extends Mapper<LongWritable, Text,Text,PhoneBean> {
Text keyout=new Text();
PhoneBean valueout=new PhoneBean();
//重写map方法
@Override
protected void map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, PhoneBean>.Context context) throws IOException, InterruptedException {
//获取一行值,切分数据,获取想要的字段,封装到phone Flow
//1,获取一行数据,转换成字符串
String line = value.toString();
//源文件里面的字段以\t制表符切分,我们就以\t来切割
//2,切割字段
String[] split = line.split("\t");
//去除想要的数据,封装到对象里面
//1363157985066 13726230503112 00-FD-07-A4-72-B8:CMCC 120.196.100.82 i02.c.aliimg.com 24 27 2481 24681 200
//这个集合里面的第二个是手机号
//3,取出想要的数据
String phoneNum=split[1];
// 倒数第三个是上行流量
long upFlow=Long.parseLong(split[split.length-3]);
//倒数第二个是下行流量
long downFlow=Long.parseLong(split[split.length-2]);
//4,封装对象
valueout.setUpFlow(upFlow);
valueout.setDownFlow(downFlow);
valueout.setSumFlow(upFlow+downFlow);
valueout.setPhoneNUmber(phoneNum);
//写出数据
keyout.set(phoneNum);
context.write(keyout,valueout);
}
}
这里我们主要实现了两大功能,第一:封装了bean。第二:设置手机号为map的keyout值,以bean对象为valueout,也就是这样:

到这里,map就写完了。

浙公网安备 33010602011771号