会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
ralgo
博客园
首页
新随笔
联系
订阅
管理
2021年6月24日
Spark(一)为什么Spark要比Hadoop MapReduce快?
摘要: MapReduce是一种框架,所谓框架,也即是一个“条条框框”。那么MapReduce的“条条框框”如下: 1、每启动一个任务,就会启动一个JVM,JVM启动是非常耗时的操作,因为一个JVM需要加载很多数据比如很多jar,很多类等等。 2、中间结果要基于磁盘来排序,因为reduce只能读以key排好
阅读全文
posted @ 2021-06-24 14:28 ralgo
阅读(659)
评论(0)
推荐(0)
公告