今日总结10.11

请在以下两题中任选一题作答:

(1)通过查阅资料,写出一个或多个MapReduce的具体应用,并谈谈自己对MapReduce的认识。(满分10分)

(2)词频统计任务编程实践,任务要求:在Linux系统本地创建两个文件,即文件wordfile1.txt和wordfile2.txt,文件wordfile1.txt的内容格式如下,需要将zhangsan换成自己名字的英文全拼:

zhangsan loves Spark

zhangsan loves Hadoop

文件wordfile2.txt的内容如下:

 

Hadoop is good

Spark is fast

请对这两个小数据集样本编写MapReduce词频统计程序,并截图给出统计结果,可参考相关教程https://dblab.xmu.edu.cn/blog/2481/。(满分20分)

 

posted @ 2023-10-11 23:02  庞司令  阅读(16)  评论(0)    收藏  举报