摘要:
原理流程分析 Map端: 文件存储在HDFS中,每个文件切分成多个一定大小(默认128M)的Block(默认3个备份)存储在多个数据节点上,数据格定义以"\n"分割每条记录,以空格区分一个目标单词。 每读取一条记录,调用一次map函数,然后继续读取下一条记录直到split尾部。 map 输出的结果暂 阅读全文
posted @ 2020-01-28 15:14
Jasongo
阅读(723)
评论(0)
推荐(0)
浙公网安备 33010602011771号