TextInputFormat
,key
偏移量,value
一行内容。CombineTextInputFormat
把多个文件合并到一起统一切片。setup()
初始化;map()
用户的业务逻辑;clearup()
关闭资源HashPartitioner
,默认按照key
的hash值%numreducertask的个数
reducer
,对所有数据大排序。writableCompare
接口,重写compareTo
方法(总流量排序 按照上行流量 正序)setup()
初始化;reducer()
用户的业务逻辑;clearup()
关闭资源TextOutputFormat
按行输出到文件