hadoop二:一个hadoop示例

一个mapduce的示例:

统计hodoop文件夹下的xml文件中的单词数量:

mkdir ~/input
cp /usr/local/hadoop-2.9.1/*.xml ~/input/
hadoop jar ./share/hadoop/mapreduce/hadoop-mapredue-examples-2.9.1.jar wordcount ~/input/ ~/output

 

output目录不能事先存在,否则可能会覆盖文件。

速度非常快,命令也非常简单使用mapduce下的一个命令,即实现了众多目录下众多文件中的单词的统计。

more ~/output/

 

posted on 2018-09-06 22:17  myworldworld  阅读(78)  评论(0)    收藏  举报

导航