随笔分类 -  kafka

摘要:1、要往 Kafka 写入消息,首先要创建一个生产者对象,井设置一些属 Kafka 生产者有 个必选的属性。 1>bootstrap.servers 指定broker的地址清单,指定格式为host:port,清单里不需要包含所有的broker信息,可以指定一个broker,但是避免这台机器宕机而影响 阅读全文
posted @ 2020-08-18 18:07 时光剑客 阅读(374) 评论(0) 推荐(0)
摘要:fetch.min.bytes 该属性指定了消费者’从服务器获取记录的最小字节数。 broker 在收到消费者的数据请求时, 如果可用的数据量小于fetch.min.bytes 指定的大小,那么它会等到有足够的可用数据时才把它返回给消费者。 作用:可以降低消费者和 broker 的工作负载,因为它们 阅读全文
posted @ 2020-08-10 18:10 时光剑客 阅读(3064) 评论(0) 推荐(0)
摘要:Kafka 流数据 SQL 引擎 -- KSQL 阅读全文
posted @ 2020-08-07 18:48 时光剑客 阅读(1386) 评论(0) 推荐(0)
摘要:最近在spark读取kafka消息时,每次读取都会从kafka最新的offset读取。但是如果数据丢失,如果在使用Kafka来分发消息,在数据处理的过程中可能会出现处理程序出异常或者是其它的错误,会造成数据丢失或不一致。这个时候你也许会想要通过kafka把数据从新处理一遍,或者指定kafka的off 阅读全文
posted @ 2020-02-16 21:39 时光剑客 阅读(1090) 评论(0) 推荐(0)
摘要:follower故障 follower发生故障后会被临时踢出ISR,待该follower恢复后,follower会读取本地磁盘记录的上次的HW,并将log文件高于HW的部分截取掉,从HW开始向leader进行同步。等该follower的LEO大于等于该Partition的HW,即follower追上 阅读全文
posted @ 2020-02-16 20:48 时光剑客 阅读(445) 评论(0) 推荐(0)