摘要:
本文尝试从源码层面梳理Spark在任务调度与资源分配上的做法。 先从Executor和SchedulerBackend说起。Executor是真正执行任务的进程,本身拥有若干cpu和内存,可以执行以线程为单位的计算任务,它是资源管理系统能够给予的最小单位。SchedulerBackend是spark 阅读全文
posted @ 2016-07-08 13:53
XGogo
阅读(2154)
评论(0)
推荐(0)
摘要:
Spark是基于内存的分布式计算引擎,以处理的高效和稳定著称。然而在实际的应用开发过程中,开发者还是会遇到种种问题,其中一大类就是和性能相关。在本文中,笔者将结合自身实践,谈谈如何尽可能地提高应用程序性能。 分布式计算引擎在调优方面有四个主要关注方向,分别是CPU、内存、网络开销和I/O,其具体调优 阅读全文
posted @ 2016-07-08 13:53
XGogo
阅读(2920)
评论(0)
推荐(0)

浙公网安备 33010602011771号