2016 年 11月 14 日随笔档案 - Namhwik

Spark 累加器

摘要：由于spark是分布式的计算，所以使得每个task间不存在共享的变量，而为了实现共享变量spark实现了两种类型 - 累加器与广播变量，对于其概念与理解可以参考：共享变量(广播变量和累加器) 。可能需要注意：Spark累加器(Accumulator)陷阱及解决办法因此，我们便可以利用累加器与广播阅读全文

posted @ 2016-11-14 00:44 Namhwik 阅读(2064) 评论(0) 推荐(0)

2016年11月14日

公告