摘要: 1.分布式代码执行的重要特征 代码在集群上运行,是分布式运行的 在spark中,非任务处理部分由driver执行(非rdd代码) 任务处理部分由executor执行(rdd代码) executor的数量可以很多,所以人物的计算是分布式在运行的 2.pyspark的架构体系 python on spa 阅读全文
posted @ 2024-01-25 21:18 代不动码 阅读(8) 评论(0) 推荐(0)