摘要: 需求1:求出每一个url被访问的总次数,并将结果输出到一个结果文件中 思路:就是一个wordcount map阶段: 解析数据,将url作为key,1作为value发出 reduce阶段:将一组数据的value累加 需求2:求出每个网站被访问次数最多的top3个url《分组TOPN》 思路: map 阅读全文
posted @ 2020-08-31 17:57 祈欢 阅读(120) 评论(0) 推荐(0)