摘要:
首先简单解释一下什么是state(状态)管理?我们以wordcount为例。每个batchInterval会计算当前batch的单词计数,那如果需要计算从流开始到目前为止的单词出现的次数,该如计算呢?SparkStreaming提供了两种方法:updateStateByKey和mapWithState 。mapWithState 是1.6版本新增功能,目前属于实验阶段。mapWithSta... 阅读全文
posted @ 2016-06-03 14:34
听风居士
阅读(2758)
评论(1)
推荐(0)

浙公网安备 33010602011771号