会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
云山之巅
------自学是你超越他人使自己变的重要的一种能力!
博客园
新随笔
联系
管理
2018年7月28日
Spark性能优化(基于Spark 1.x)
摘要: Task优化: 1.慢任务的性能优化:可以考虑减少每个Partition处理的数据量,同时建议开启spark.speculation(慢任务推导,当检测的慢任务时,会同步开启相同的新任务,谁先完成就认定该任务完成)。 2.尽量减少Shuffle,例如我们要尽量减少groupByKey的操作,因为gr
阅读全文
posted @ 2018-07-28 21:50 云山之巅
阅读(255)
评论(0)
推荐(0)
公告