java/Java Pyton 大数据 Hadoop Spark

随笔分类 -  kafka

摘要:通常情况下,我们都是使用一套kafka集群处理业务。但有些情况需要使用另一套kafka集群来进行数据同步和备份,比如需要更高的 SLA~ 阅读全文
posted @ 2021-01-12 21:00 zzzzMing 阅读(6421) 评论(1) 推荐(1)
摘要:在kafka2.4的时候,社区推出两个新feature来解决重平衡过程中stop the world的问题。 1. Incremental Rebalance Protocol(以下简称cooperative协议):改进了eager协议(即旧重平衡协议)的问题,避免STW的发生 2. static membership:避免重起或暂时离开的消费者触发重平衡 本篇接下来主要介绍这两点。 阅读全文
posted @ 2020-12-23 20:19 zzzzMing 阅读(4311) 评论(1) 推荐(0)
摘要:最近看了kafka2.4新版本的一些功能特性,不得不说,在kafka2.0以后,kafka自身就比较少推出一些新的feature了,基本都是一些修修补补的东西。倒是kafka connect和kafka stream相关的开发工作做的比较多。可能kafka的野心也不局限于要当一个中间件,而是要实现一 阅读全文
posted @ 2020-12-02 20:31 zzzzMing 阅读(1828) 评论(1) 推荐(0)
摘要:消费组组(Consumer group)可以说是kafka很有亮点的一个设计。传统的消息引擎处理模型主要有两种, 队列模型 ,和 发布 订阅模型 。 队列模型 :早期消息处理引擎就是按照队列模型设计的,所谓队列模型,跟队列数据结构类似,生产者产生消息,就是入队,消费者接收消息就是出队,并删除队列中数 阅读全文
posted @ 2020-04-08 21:33 zzzzMing 阅读(18381) 评论(2) 推荐(4)
摘要:在很多的流处理框架的介绍中,都会说kafka是一个可靠的数据源,并且推荐使用Kafka当作数据源来进行使用。这是因为与其他消息引擎系统相比,kafka提供了可靠的数据保存及备份机制。并且通过消费者位移这一概念,可以让消费者在因某些原因宕机而重启后,可以轻易得回到宕机前的位置。 但其实kafka的可靠 阅读全文
posted @ 2020-03-16 18:12 zzzzMing 阅读(3038) 评论(1) 推荐(1)
摘要:本篇主要介绍kafka的分区和副本,因为这两者是有些关联的,所以就放在一起来讲了,后面顺便会给出一些对应的配置以及具体的实现代码,以供参考~ 1.kafka分区机制 分区机制是kafka实现高吞吐的秘密武器,但这个武器用得不好的话也容易出问题,今天主要就来介绍分区的机制以及相关的部分配置。 首先,从 阅读全文
posted @ 2020-03-11 21:07 zzzzMing 阅读(35656) 评论(2) 推荐(9)
摘要:如何将 Mysql 数据写入 Kafka 呢?我们可以使用一个小工具。。。 阅读全文
posted @ 2018-12-08 21:09 zzzzMing 阅读(4426) 评论(0) 推荐(1)
摘要:版权声明:本文为博主原创文章,未经博主允许不得转载 本文是基于hadoop 2.7.1,以及kafka 0.11.0.0。kafka-connect是以单节点模式运行,即standalone。 一. 首先,先对kafka和kafka connect做一个简单的介绍 kafka:Kafka是一种高吞吐 阅读全文
posted @ 2018-03-23 15:13 zzzzMing 阅读(15856) 评论(8) 推荐(1)