会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
afra17
博客园
首页
新随笔
联系
订阅
管理
2023年12月13日
[spark] coalesce() 和 repartition()的区别
摘要: coalesce(1) 的主要作用是将数据合并到尽可能少的分区中,而 repartition(1) 则是将数据随机重分区为一个分区。这使得 coalesce(1) 相对而言更加高效,因为它减少了数据移动的次数,只需要在当前 Executor 上将所有分区的数据都收集到当前应用程序的单个 Execut
阅读全文
posted @ 2023-12-13 10:03 家有花猪
阅读(372)
评论(0)
推荐(0)
公告