2017年2月23日
摘要: 1、降低cache操作的内存占比 1.1 为什么要降低cache操作的内存占比 spark的堆内存分别两部分,一部分用来给Rdd的缓存进行使用,另一部分供spark算子函数运行使用,存放函数中的对象 默认情况下,供Rdd缓存使用的占0.6,但是,有些时候,不需要那么多的缓存,反而函数计算需要更多的内 阅读全文
posted @ 2017-02-23 17:02 YL10000 阅读(1913) 评论(0) 推荐(0) 编辑
摘要: 1、分配更多的资源 1.1 分配的资源有:executor、cup per executor、memory per executor、driver memory 1.2 如何分配:在spark-submit提交时设置相应的参数 1.3 调节到多大(原则:能使用的资源有多大,就尽量调节到最大的大小) 阅读全文
posted @ 2017-02-23 14:33 YL10000 阅读(494) 评论(0) 推荐(0) 编辑