文章分类 -  spark

摘要:深入Spark "Locality level"(Spark-2.3.0版本)1、可以在Spark job ui上查看到 2、Locality level解释说明:为了保证没有理解的偏差,将把英文原文说明粘贴如下。 Data locality can have a major impact on t 阅读全文
posted @ 2019-06-13 13:44 PigeonNoir 阅读(565) 评论(0) 推荐(0)
摘要:Spark有几种部署的模式,单机版、集群版等等,平时单机版在数据量不大的时候可以跟传统的java程序一样进行断电调试、但是在集群上调试就比较麻烦了...远程断点不太方便,只能通过Log的形式进行数据分析,利用spark ui做性能调整和优化。 那么本篇就介绍下如何利用Ui做性能分析,因为本人的经验也 阅读全文
posted @ 2019-06-13 10:42 PigeonNoir 阅读(196) 评论(0) 推荐(0)
摘要:转自:http://blog.csdn.net/ljj657137723/article/details/52134962 本篇文章是关于我在学习Spark过程中遇到的一些问题及总结,分为Spark优化、RDD join问题、遇到的问题、总结、参考资料几个部分。 一:Spark优化 1、设置序列化器 阅读全文
posted @ 2019-04-01 22:36 PigeonNoir 阅读(333) 评论(0) 推荐(0)
摘要:必要配置 通过下面参数开启DRA 设置最大最小的Executor 数目: 可选配置 这些参数可以不用配置,都已经提供了一个较为合理的默认值 开启日志: 设置DRA 生效延时: 设置DRA 计算资源量时参考的周期数: 设置DRA 释放资源的步调: 设置DRA 资源额外保留比例: DRA 算法说明 减少 阅读全文
posted @ 2019-03-19 17:53 PigeonNoir 阅读(430) 评论(0) 推荐(0)