【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群(第五步)(12)

第三步:测试Spark集群

把Spark安装包下的README.txt上传到

通过hdfs的web控制台可以发现成功上传了文件:

 

使用“MASTER:spark://SparkMaster:7077 ./spark-shell”命令启动Spark shell:

接下来通过以下命令读取刚刚上传到HDFS上的“README.md”文件 :

对读取的文件进行以下操作:

接下来使用collect命令提交并执行Job:

 

posted on 2014-11-19 13:04  spark亚太研究院  阅读(154)  评论(0编辑  收藏  举报

导航