摘要:
1.提交应用程序 在提交应用程序的时候,用到 spark-submit 脚本。我们来看下这个脚本: 可以看出来 spark-class 脚本才是真正的提交程序的,spark-submit 脚本只是在其上封装一层,并传参 org.apache.spark.deploy.SparkSubmit 给它。这 阅读全文
posted @ 2018-06-15 22:19
大葱拌豆腐
阅读(700)
评论(0)
推荐(0)
摘要:
1.Spark 属性Spark应用程序的运行是通过外部参数来控制的,参数的设置正确与否,好与坏会直接影响应用程序的性能,也就影响我们整个集群的性能。参数控制有以下方式:(1)直接设置在SparkConf,通过参数的形式传递给SparkContext,达到控制目的。(通过set()方法传入key-va 阅读全文
posted @ 2018-06-15 22:02
大葱拌豆腐
阅读(476)
评论(0)
推荐(0)
摘要:
SparkSQL数据源:从各种数据源创建DataFrame 因为 spark sql,dataframe,datasets 都是共用 spark sql 这个库的,三者共享同样的代码优化,生成以及执行流程,所以 sql,dataframe,datasets 的入口都是 sqlContext。 可用于 阅读全文
posted @ 2018-06-15 18:57
大葱拌豆腐
阅读(535)
评论(0)
推荐(0)
摘要:
一个job的生命历程 (1)所有的action算子都会触发一个job的调度,经过多次不同的runjob重载后停在这里调度 submitJob (2)调用eventProcessLoop方法,并发送 JobSubmitted 消息给DAGSchedulerEventProcessLoop(DAGSch 阅读全文
posted @ 2018-06-15 00:00
大葱拌豆腐
阅读(672)
评论(0)
推荐(0)
浙公网安备 33010602011771号