会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
scales123
博客园
首页
新随笔
联系
订阅
管理
2025年12月2日
spark的共享变量之广播变量和累加器
摘要: 1 核心概念:为什么需要它们? 在spark程序中,当一个传递给Spark操作(例如map和reduce)的函数在远程节点上面运行时,Spark操作实际上操作的是这个函数所用变量的一个独立副本。这些变量会被复制到每台机器上,并且这些变量在远程机器上的所有更新都不会传递回驱动程序。通常跨任务的读写变量
阅读全文
posted @ 2025-12-02 23:01 scales123
阅读(49)
评论(0)
推荐(0)
公告