MapReduce实现词频统计
1.切换目录到/apps/hadoop/sbin下,启动hadoop。
2.在linux上,创建一个目录/data/mapreduce1。
3.切换到/data/mapreduce1目录下,使用wget命令从网址 http://192.168.1.150:60000/allfiles/mapreduce1/buyer_favorite1,下载文本文件buyer_favorite1。
4.将linux本地/data/mapreduce1/buyer_favorite1,上传到HDFS上的/mymapreduce1/in目录下。若HDFS目录不存在,需提前创建。
5.打开Eclipse,新建Java Project项目。编写Java代码,实现词频统计。

浙公网安备 33010602011771号