Spark sumbit command on yarn

下面是一个spark提交的例子

spark-submit --class HiveColNullRatioStats --master yarn --deploy-mode client --num-executors 3 --executor-memory 6G --executor-cores 2 --driver-memory 1G /home/hypers/Jason/tmp/spark_practice-1.0-SNAPSHOT.jar -s east -p 20170731

在调试情况下，可以使用client方式，对于想要看到的信息，可以使用这种方式打印到客户端。

在实际运行时，需要采用cluster模式

查看运行结果时候就采用下面的yarn命令

yarn logs -applicationId <app ID>

对于参数的选择，请参考blog https://www.cnblogs.com/haoyy/p/6893943.html

官方文档 http://spark.apache.org/docs/1.5.2/running-on-yarn.html

不同提交模式的区别，请参考 https://www.jianshu.com/p/65a3476757a5

posted @ 2019-04-01 17:20 代号菜鸟阅读(208) 评论(0) 收藏举报

刷新页面返回顶部

代号菜鸟

Spark sumbit command on yarn

公告