会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Chen洋
博客园
首页
新随笔
联系
订阅
管理
随笔分类 -
Spark
Spark中的reduceByKey()和groupByKey()的区别
摘要:一、先看结论1.从Shuffle的角度 reduceByKey 和 groupByKey都存在shuffle操作,但是reduceByKey可以在shuffle之前对分区内相同key的数据集进行预聚合(combine)功能,这样会较少落盘的数据量,而groupByKey只是进行分组,不存在数据量减少
阅读全文
posted @
2021-11-17 16:57
Chen洋
阅读(1700)
评论(0)
推荐(0)
公告