摘要:
Spark 任务执行的流程 四个步骤1.构建DAG(调用RDD上的方法)2.DAGScheduler将DAG切分Stage(切分的依据是Shuffle),将Stage中生成的Task以TaskSet的形式给TaskScheduler3.TaskScheduler调度Task(根据资源情况将Task调 阅读全文
posted @ 2021-05-28 11:12
每天都要进步啊
阅读(1067)
评论(0)
推荐(0)
摘要:
1.SparkContext哪一端生成的? Driver端 2.DAG是在哪一端被构建的? Driver端 3.RDD是在哪一端生成的? Driver端 4.广播变量是在哪一端调用的方法进行广播的? Driver端 5.要广播的数据应该在哪一端先创建好再广播呢? Driver端 6.调用RDD的算子 阅读全文
posted @ 2021-05-28 10:58
每天都要进步啊
阅读(55)
评论(0)
推荐(0)

浙公网安备 33010602011771号