欢迎来到我的博客小站。  交流请加我微信好友: studyjava。  也欢迎关注公众号:Java学习之道 Fork me on GitHub
摘要: Spark内存管理机制 Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色。理解 Spark 内存管理的基本原理,有助于更好地开发 Spark 应用程序和进行性能调优。 在执行 Spark 的应用程序时,Spark 集群会启动 Driver 和 Execut 阅读全文
posted @ 2018-02-03 11:54 淼淼之森 阅读(1879) 评论(0) 推荐(3)
摘要: Shuffle过程 在MapReduce框架中,shuffle是连接Map和Reduce之间的桥梁,Map的输出要用到Reduce中必须经过shuffle这个环节,shuffle的性能高低直接影响了整个程序的性能和吞吐量。Spark作为MapReduce框架的一种实现,也实现了shuffle的逻辑。 阅读全文
posted @ 2018-02-03 11:54 淼淼之森 阅读(361) 评论(0) 推荐(0)
  👉转载请注明出处和署名