摘要: 作者从容错、性能等方面优化了长时间运行在yarn上的spark-Streaming作业 对于长时间运行的Spark Streaming作业,一旦提交到YARN群集便需要永久运行,直到有意停止。任何中断都会引起严重的处理延迟,并可能导致数据丢失或重复。YARN和Apache Spark都不是为了执行长 阅读全文
posted @ 2017-09-30 15:02 Mr.Ming2 阅读(5543) 评论(0) 推荐(2) 编辑
摘要: 生产者 消费者 查询topic的offset offset最小值 offset最大值 可以查询出offset的范围 阅读全文
posted @ 2017-09-30 10:59 Mr.Ming2 阅读(341) 评论(0) 推荐(0) 编辑