1.默认的是
2.处理小文件
1.默认分区
2.全排序:一个
3.二次排序:自定义排序范畴,实现
2.
1.默认
TextInputFormat,key偏移量,value一行内容。CombineTextInputFormat把多个文件合并到一起统一切片。setup()初始化;map()用户的业务逻辑;clearup()关闭资源HashPartitioner,默认按照key的hash值%numreducertask的个数reducer,对所有数据大排序。writableCompare接口,重写compareTo方法(总流量排序 按照上行流量 正序)setup()初始化;reducer()用户的业务逻辑;clearup()关闭资源TextOutputFormat按行输出到文件