随笔分类 -  Kafka

摘要:最近在搞spark streaming,很自然的前端对接的就是kafka。不过在kafka的使用中还是遇到一些问题,比如mirrormaker莫名其妙的丢失数据[原因稍后再说],消费数据offset错乱[之后介绍spark streaming的时候再解释] 总之,还是遇到了不少的问题。本篇就从下面几 阅读全文
posted @ 2017-12-06 19:07 xingoo 阅读(1368) 评论(0) 推荐(0) 编辑
摘要:基于Logstash跑通Kafka还是需要注意很多东西,最重要的就是理解Kafka的原理。 Logstash工作原理 由于Kafka采用解耦的设计思想,并非原始的发布订阅,生产者负责产生消息,直接推送给消费者。而是在中间加入持久化层——broker,生产者把数据存放在broker中,消费者从brok 阅读全文
posted @ 2016-08-04 21:33 xingoo 阅读(25930) 评论(5) 推荐(5) 编辑
摘要:Kafka是目前非常流行的消息队列中间件,常用于做普通的消息队列、网站的活性数据分析(PV、流量、点击量等)、日志的搜集(对接大数据存储引擎做离线分析)。 全部内容来自网络,可信度有待考证!如有问题,还请及时指正。 概念介绍 在Kafka中消息队列分为三种角色: ,即生产者,负责产生日志数据。 ,存 阅读全文
posted @ 2016-08-02 18:52 xingoo 阅读(2582) 评论(0) 推荐(4) 编辑