摘要: PIDRateEstimator是Spark Streaming用来实现backpressure的关键组件。 看了一些博客文章,感觉对它的解释都没有说到要点,还是自己来研究一下比较好。 首先,需要搞清楚的一个问题是Spark Streaming的backpressure是想让系统达到怎么样的一种状态 阅读全文
posted @ 2018-08-30 22:11 devos 阅读(760) 评论(0) 推荐(0) 编辑
摘要: Kafka添加了事务机制以后,consumer端有个需要解决的问题就是怎么样从收到的消息中滤掉aborted的消息。Kafka通过broker和consumer端的协作,利用一系列优化手段极大地降低了这部分工作的开销。 问题 首先来看一下这部分工作的难点在哪。 对于isolation.level为r 阅读全文
posted @ 2018-08-30 22:05 devos 阅读(8397) 评论(1) 推荐(2) 编辑