S++

千线一眼

导航

2022年4月18日 #

hadoop入门(14):MapReduce

摘要: Map阶段执行过程 第一阶段: 把输入目录下的文件按照一定标准逐个进行逻辑切片,形成切片规划。 默认切片大小和块的大小相同128M,每一个切片由一个MapTask处理。 第二阶段: 对切片数据按照一定规则读取解析返回<key,value>对。 默认按行读取数据。key是每一行起始位置的偏移量,val 阅读全文

posted @ 2022-04-18 19:50 S++ 阅读(46) 评论(0) 推荐(0)