上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 23 下一页
摘要: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 阅读全文
posted @ 2016-07-17 17:47 XGogo 阅读(1446) 评论(0) 推荐(0)
摘要: 广播变量 背景 一般Task大小超过10K时(Spark官方建议是20K),需要考虑使用广播变量进行优化。大表小表Join,小表使用广播的方式,减少Join操作。 参考:Spark广播变量与累加器 Local Dir 背景 shuffle过程中,临时数据需要写入本地磁盘。本地磁盘的临时目录通过参数s 阅读全文
posted @ 2016-07-15 18:05 XGogo 阅读(4150) 评论(0) 推荐(0)
摘要: Spark是基于内存的分布式计算引擎,以处理的高效和稳定著称。然而在实际的应用开发过程中,开发者还是会遇到种种问题,其中一大类就是和性能相关。在本文中,笔者将结合自身实践,谈谈如何尽可能地提高应用程序性能。 分布式计算引擎在调优方面有四个主要关注方向,分别是CPU、内存、网络开销和I/O,其具体调优 阅读全文
posted @ 2016-07-08 13:53 XGogo 阅读(2920) 评论(0) 推荐(0)
摘要: 本文尝试从源码层面梳理Spark在任务调度与资源分配上的做法。 先从Executor和SchedulerBackend说起。Executor是真正执行任务的进程,本身拥有若干cpu和内存,可以执行以线程为单位的计算任务,它是资源管理系统能够给予的最小单位。SchedulerBackend是spark 阅读全文
posted @ 2016-07-08 13:53 XGogo 阅读(2154) 评论(0) 推荐(0)
摘要: 在Sortable公司,很多数据处理的工作都是使用Spark完成的。在使用Spark的过程中他们发现了一个能够提高Sparkjob性能的一个技巧,也就是修改数据的分区数,本文将举个例子并详细地介绍如何做到的。 查找质数 比如我们需要从2到2000000之间寻找所有的质数。我们很自然地会想到先找到所有 阅读全文
posted @ 2016-07-07 11:27 XGogo 阅读(758) 评论(0) 推荐(0)
摘要: 下面这些关于Spark的性能调优项,有的是来自官方的,有的是来自别的的工程师,有的则是我自己总结的。 Data Serialization,默认使用的是Java Serialization,这个程序员最熟悉,但是性能、空间表现都比较差。还有一个选项是Kryo Serialization,更快,压缩率 阅读全文
posted @ 2016-07-06 23:11 XGogo 阅读(395) 评论(0) 推荐(0)
摘要: 【编者按】时至今日,Spark已成为大数据领域最火的一个开源项目,具备高性能、易于使用等特性。然而作为一个年轻的开源项目,其使用上存在的挑战亦不可为不大,这里为大家分享SciSpike软件架构师Ashwini Kuntamukkala在Dzone上进行的Spark入门总结(虽然有些地方基于的是Spa 阅读全文
posted @ 2016-07-06 09:52 XGogo 阅读(690) 评论(0) 推荐(0)
摘要: Here's a quick look at how to use the Scala Map class, with a colllection of Map class examples. The immutable Map class is in scope by default, so yo 阅读全文
posted @ 2016-07-05 22:38 XGogo 阅读(187) 评论(0) 推荐(0)
摘要: The Scala List class filter method implicitly loops over the List/Seq you supply, tests each element of the List with the function you supply. Your fu 阅读全文
posted @ 2016-07-05 22:36 XGogo 阅读(308) 评论(0) 推荐(0)
摘要: Scala List FAQ: How do I add elements to a Scala List? This is actually a trick question, because you can't add elements to a ScalaList; it's an immut 阅读全文
posted @ 2016-07-05 22:20 XGogo 阅读(382) 评论(0) 推荐(0)
上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 23 下一页