kafka教程

一、理论介绍
(一)相关资料
1、官方资料,很具体:
   http://kafka.apache.org/documentation.html#quickstart
2、有一篇翻译版。基本一致。有些细节不同,建议入门时先读此文。再读官方文档。

若自认英语非常强,请忽视:
   http://www.linuxidc.com/Linux/2014-07/104470.htm
3、另一文也能够:
http://www.sxt.cn/info-2871-u-324.html
其主要内容来源于下面三篇文章:
日志:每一个软件project师都应该知道的有关实时数据的统一概念 —— 这篇比較抽象,高屋建瓴,理论先行
Building LinkedIn’s Real-time Activity Data Pipeline —— 实践层的论文,把做事情的前因后果都写明确了
分布式公布订阅消息系统 Kafka 架构设计 —— 落地设计

(二)kafka是什么?

 1、Kafka is a distributed, partitioned, replicated commit log service. It provides the functionality of a messaging system, but with a unique design.
Kafka是一个 分布式的、可分区的、可复制的消息系统。它提供了普通消息系统的功能,但具有自己独特的设计。



2、能够简单的理解为:kafka是一个日志集群,各种各样的server将它们自身的日志发送到集群中进行统一汇总和存储。然后其他机器从集群中拉取消息进行分析处理,如ELT、数据挖掘等。



3、kafka提供了JAVA API,同一时候对多种语言都提供了支持。

(三)主要的架构
首先让我们看几个主要的消息系统术语:
Kafka将消息以topic为单位进行归纳。
将向Kafka topic公布消息的程序称为producers.
将预订topics并消费消息的程序称为consumer.
Kafka以集群的方式执行,能够由一个或多个服务组成,每一个服务叫做一个broker.
producers通过网络将消息发送到Kafka集群,集群向consumers提供消息,例如以下图所看到的:

(四)分区与副本
1、一个topic是对一组消息的归纳。对每一个topic,Kafka 对它的日志进行了分区,例如以下图所看到的:

 
2、一般而言,一个topic会有多个分区,每一个分区会有多个副本。
分区是分了将一个topic分到多个地方存储,提高并行处理的能力。副本是为了容错,保证数据不丢失。



3、对于每个分区。都会选取一个leader。这个分区的全部读取都在这个leader中进行,而其他副本会同步leader中的数据,且仅仅做备份。
即leader仅仅是针对一个分区而言,而非整个集群。

一个server对于某个分区是leader,对于其他分区可能是follower。



4、 Producer将消息公布到它指定的topic中,并负责决定公布到哪个分区。通常简单的由负载均衡机制随机选择分区,但也能够通过特定的分区函数选择分区。

使用的很多其它的是另外一种。



5、公布消息通常有两种模式:队列模式(queuing)和公布-订阅模式(publish-subscribe)。

队列模式中。consumers能够同一时候从服务端读取消息,每一个消息仅仅被当中一个consumer读到。公布-订阅模式中消息被广播到全部的consumer中。



Consumers能够增加一个consumer 组。共同竞争一个topic,topic中的消息将被分发到组中的一个成员中。

同一组中的consumer能够在不同的程序中,也能够在不同的机器上。假设全部的consumer都在一个组中,这就成为了传统的队列模式。在各consumer中实现负载均衡。

假设全部的consumer都不在不同的组中,这就成为了公布-订阅模式。全部的消息都被分发到全部的consumer中。

更常见的是。每一个topic都有若干数量的consumer组,每一个组都是一个逻辑上的“订阅者”,为了容错和更好的稳定性,每一个组由若干consumer组成。

这事实上就是一个公布-订阅模式,仅仅只是订阅者是个组而不是单个consumer。

由两个机器组成的集群拥有4个分区 (P0-P3) 2个consumer组. A组有两个consumerB组有4个
 
相比传统的消息系统,Kafka能够非常好的保证有序性。
传统的队列在server上保存有序的消息。假设多个consumers同一时候从这个server消费消息,server就会以消息存储的顺序向consumer分 发消息。尽管server按顺序公布消息,可是消息是被异步的分发到各consumer上。所以当消息到达时可能已经失去了原来的顺序。这意味着并发消费将导致 顺序错乱。为了避免故障,这种消息系统通常使用“专用consumer”的概念,事实上就是仅仅同意一个消费者消费消息,当然这就意味着失去了并发性。
 
在这方面Kafka做的更好。通过分区的概念,Kafka能够在多个consumer组并发的情况下提供较好的有序性和负载均衡。

将每一个分区分 仅仅分发给一个consumer组。这样一个分区就仅仅被这个组的一个consumer消费。就能够顺序的消费这个分区的消息。由于有多个分区,依旧能够在多 个consumer组之间进行负载均衡。注意consumer组的数量不能多于分区的数量,也就是有多少分区就同意多少并发消费。
 
Kafka仅仅能保证一个分区之内消息的有序性,在不同的分区之间是不能够的,这已经能够满足大部分应用的需求。假设须要topic中全部消息的有序性。那就仅仅能让这个topic仅仅有一个分区。当然也就仅仅有一个consumer组消费它。

二、安装部署
(一)单机版安装

Step 1: 下载Kafka

下载最新的版本号并解压.

$ wget http://mirrors.cnnic.cn/apache/kafka/0.8.2.1/kafka_2.10-0.8.2.1.tgz
$ tar -zxvf kafka_2.10-0.8.2.1.tgz
Step 2: 启动服务

Kafka用到了Zookeeper,全部首先启动Zookper,以下简单的启用一个单实例的Zookkeeper服务。能够在命令的结尾加个&符号,这样就能够启动后离开控制台。
> bin/zookeeper-server-start.sh config/zookeeper.properties &
...
如今启动Kafka:
> bin/kafka-server-start.sh config/server.properties

Step 3: 创建 topic

创建一个叫做“test”的topic,它仅仅有一个分区。一个副本。
> bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test
[2015-06-04 13:17:13,943] WARN Connected to an old server; r-o mode will be unavailable (org.apache.zookeeper.ClientCnxnSocket)
Created topic "test".
能够通过list命令查看创建的topic:  
> bin/kafka-topics.sh --list --zookeeper localhost:2181
test
除了手动创建topic,还能够配置broker让它自己主动创建topic.
Step 4:发送消息.

Kafka 使用一个简单的命令行producer,从文件里或者从标准输入中读取消息并发送到服务端。默认的每条命令将发送一条消息。     

执行producer并在控制台中输一些消息,这些消息将被发送到服务端:
> bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test
This is a messageThis is another message
ctrl+c能够退出发送。
默认情况下。日志数据会被放置到/tmp/kafka-logs中。每一个分区一个文件夹
Step 5: 启动consumer

Kafka also has a command line consumer that will dump out messages to standard output.
Kafka也有一个命令行consumer能够读取消息并输出到标准输出:
> bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic test --from-beginning
This is a message
This is another message
你在一个终端中执行consumer命令行,还有一个终端中执行producer命令行。就能够在一个终端输入消息。还有一个终端读取消息。
这两个命令都有自己的可选參数。能够在执行的时候不加不论什么參数能够看到帮助信息。



(二)集群安装

注意,必须先搭建zookeeper集群。搭建方法请见????

1、使用3台机器搭建Kafka集群:

192.168.169.92 gdc-dn01-test
192.168.169.93 gdc-dn02-test
192.168.169.94 gdc-dn03-test

2、在安装Kafka集群之前。这里没有使用Kafka自带的Zookeeper,而是独立安装了一个Zookeeper集群,也是使用这3台机器,保证Zookeeper集群正常执行。


3、首先,在gdc-dn01-test上准备Kafka安装文件,运行例如以下命令:

cd

wget http://mirrors.cnnic.cn/apache/kafka/0.8.2.1/kafka_2.10-0.8.2.1.tgz

tar xvzf kafka_2.10-0.8.2.1.tgz

mv kafka_2.10-0.8.2.1 kafka


4、改动配置文件kafka/config/server.properties。改动例如以下内容:

broker.id=0

zookeeper.connect=192.168.169.91:2181,192.168.169.92:2181,192.168.169.93:2181/kafka
这里须要说明的是,默认Kafka会使用ZooKeeper默认的/路径。这样有关Kafka的ZooKeeper配置就会散落在根路径以下,假设 你有其它的应用也在使用ZooKeeper集群,查看ZooKeeper中数据可能会不直观,所以强烈建议指定一个chroot路径,直接在 zookeeper.connect配置项中指定:


zookeeper.connect=192.168.169.91:2181,192.168.169.92:2181,192.168.169.93:2181/kafka
并且。须要手动在ZooKeeper中创建路径/kafka,使用例如以下命令连接到随意一台ZooKeeperserver:


cd ~/zookeeper

bin/zkCli.sh
在ZooKeeper运行例如以下命令创建chroot路径:


create /kafka ''
这样。每次连接Kafka集群的时候(使用--zookeeper选项),也必须使用带chroot路径的连接字符串,后面会看到。


5、然后,将配置好的安装文件同步到其它的dn02、dn03节点上:

scp -r /usr/local/kafka_2.10-0.8.2.1/ 192.168.169.92:/home/hadoop

scp -r /usr/local/kafka_2.10-0.8.2.1/ 192.168.169.93:/home/hadoop

6、最后,在dn02、dn03节点上配置改动配置文件kafka/config/server.properties内容例如以下所看到的:


broker.id=1  # 在dn02改动

broker.id=2  # 在dn03改动
由于Kafka集群须要保证各个Broker的id在整个集群中必须唯一。须要调整这个配置项的值(假设在单机上,能够通过建立多个Broker进程来模拟分布式的Kafka集群。也须要Broker的id唯一,还须要改动一些配置文件夹的信息)。
7、在集群中的dn01、dn02、dn03这三个节点上分别启动Kafka,分别运行例如以下命令:


bin/kafka-server-start.sh config/server.properties &
能够通过查看日志,或者检查进程状态。保证Kafka集群启动成功。


8、创建一个名称为my-replicated-topic5的Topic。5个分区。而且复制因子为3,运行例如以下命令:


bin/kafka-topics.sh --create --zookeeper 192.168.169.91:2181,192.168.169.92:2181,192.168.169.93:2181/kafka --replication-factor 3 --partitions 5 --topic my-replicated-topic5
9、查看创建的Topic。运行例如以下命令:


bin/kafka-topics.sh --describe --zookeeper 192.168.169.91:2181,192.168.169.92:2181,192.168.169.93:2181/kafka --topic my-replicated-topic5
结果信息例如以下所看到的:

Topic:my-replicated-topic5  PartitionCount:5  ReplicationFactor:3  Configs:
 Topic: my-replicated-topic5  Partition: 0  Leader: 2   Replicas: 2,0,1  Isr: 2,0,1
 Topic: my-replicated-topic5  Partition: 1  Leader: 0  Replicas: 0,1,2   Isr: 0,1,2
 Topic: my-replicated-topic5  Partition: 2  Leader: 1  Replicas: 1,2,0  Isr: 1,2,0
 Topic: my-replicated-topic5  Partition: 3  Leader: 2   Replicas: 2,1,0  Isr: 2,1,0
 Topic: my-replicated-topic5  Partition: 4  Leader: 0  Replicas: 0,2,1  Isr: 0,2,1
上面Leader、Replicas、Isr的含义例如以下:

1    Partition: 分区
2    Leader   : 负责读写指定分区的节点
3    Replicas : 复制该分区log的节点列表
4    Isr      : "in-sync" replicas。当前活跃的副本列表(是一个子集)。而且可能成为Leader
我们能够通过Kafka自带的bin/kafka-console-producer.sh和bin/kafka-console-consumer.sh脚本,来验证演示假设公布消息、消费消息。
11、在一个终端,启动Producer,并向我们上面创建的名称为my-replicated-topic5的Topic中生产消息,运行例如以下脚本:
bin/kafka-console-producer.sh --broker-list 192.168.169.92:9092, 192.168.169.93:9092, 192.168.169.94:9092 --topic my-replicated-topic5

12、在还有一个终端。启动Consumer。并订阅我们上面创建的名称为my-replicated-topic5的Topic中生产的消息,运行例如以下脚本:

bin/kafka-console-consumer.sh --zookeeper 192.168.169.91:2181,192.168.169.92:2181,192.168.169.93:2181/kafka --from-beginning --topic my-replicated-topic5
能够在Producer终端上输入字符串消息行,就能够在Consumer终端上看到消费者消费的消息内容。


也能够參考Kafka的Producer和Consumer的Java API,通过API编码的方式来实现消息生产和消费的处理逻辑。

三、配置文件

所有配置參数请 见http://kafka.apache.org/documentation.html#consumerconfigs

及http://blog.csdn.net/jinhong_lu/article/details/46518613

(一)重要配置參数
0、JVM配置 在bin/kafka-server-start.sh中加入下面内容:
export KAFKA_HEAP_OPTS="-Xms4g -Xmx4g -XX:PermSize=48m -XX:MaxPermSize=48m -XX:+UseG1GC -XX:MaxGCPauseMillis=20 -XX:InitiatingHeapOccupancyPercent=35"
1、broker.id=0 整数。建议依据ip区分,用于区分broker,确保每台机器不同

2、log.dirs=/home/data/kafka  kafka用于放置消息的文件夹。默觉得/tmp/kafka-logs

3、zookeeper.connect=192.168.169.91:2181,192.168.169.92:2181,192.168.169.93:2181/kafka zk用于放置kafka信息的地方

4、num.partitions=1 创建topic时。默认的分区数

5、num.network.threads=10  broker用于处理网络请求的线程数。如不配置默觉得3

6、zookeeper.connection.timeout.ms=6000

7、message.max.bytes=1000000000

replica.fetch.max.bytes=1073741824

一条消息的最大字节数,说明例如以下:

kafka中出现下面异常:
[2015-06-09 17:03:05,094] ERROR [KafkaApi-0] Error processing ProducerRequest with correlation id 616 from client kafka-client on partition [test3,0] (kafka.server.KafkaApis)
kafka.common.MessageSizeTooLargeException: Message size is 2211366 bytes which exceeds the maximum configured message size of 1000012.
原因是集群默认每次仅仅能接受约1M的消息。假设client一次发送的消息大于这个数值则会导致异常。
在server.properties中加入下面參数
message.max.bytes=1000000000
replica.fetch.max.bytes=1073741824
同一时候在consumer.properties中加入下面參数:
fetch.message.max.bytes=1073741824
然后重新启动kafka进程就可以,如今每次最大可接收100M的消息。
8、delete.topic.enable=true  默觉得false,即delete topic时仅仅是marked for deletion,但并不会真正删除topic。



9、关于日志的保存时间或量:
(1)log.retention.hours=24  消息被删除前保存多少小时,默认1周168小时

(2)log.retention.bytes 默觉得-1,即不大小限制。

注意此外的大小是指一个topic的一个分区的最大字节数。
当超出上述2个限制的不论什么一个时。日志均会被删除。

10、同步发送还是异步发送,异步吞吐量较大,但可能引入错误。默觉得sync
producer.type=sync|async
This parameter specifies whether the messages are sent asynchronously in a background thread. Valid values are (1) async for asynchronous send and (2) sync for synchronous send. By setting the producer to async we allow batching together of requests (which is great for throughput) but open the possibility of a failure of the client machine dropping unsent data.

11、batch.size 默认值为16384
在async模式下,producer缓存多少个消息后再一起发送

12、compression.type 默认值为none,可选gzip snappy
The compression type for all data generated by the producer. The default is none (i.e. no compression). Valid values are none, gzip, or snappy. Compression is of full batches of data, so the efficacy of batching will also impact the compression ratio (more batching means better compression).

13、default.replication.factor 消息副本的数量。默觉得1。即没有副本


下面配置说明来自网上转载:

每一个kafka broker中配置文件server.properties默认必须配置的属性例如以下:转载请注明来自:http://blog.csdn.net/lizhitao/article/details/25667831

  1. broker.id=0  
  2. num.network.threads=2  
  3. num.io.threads=8  
  4. socket.send.buffer.bytes=1048576  
  5. socket.receive.buffer.bytes=1048576  
  6. socket.request.max.bytes=104857600  
  7. log.dirs=/tmp/kafka-logs  
  8. num.partitions=2  
  9. log.retention.hours=168  
  10.   
  11. log.segment.bytes=536870912  
  12. log.retention.check.interval.ms=60000  
  13. log.cleaner.enable=false  
  14.   
  15. zookeeper.connect=localhost:2181  
  16. zookeeper.connection.timeout.ms=1000000  

server.properties中全部配置參数说明(解释)例如以下列表:

參数

说明(解释)

broker.id =0

每个broker在集群中的唯一表示。要求是正数。当该server的IP地址发生改变时,broker.id没有变化。则不会影响consumers的消息情况

log.dirs=/data/kafka-logs

kafka数据的存放地址,多个地址的话用逗号切割,多个文件夹分布在不同磁盘上能够提高读写性能  /data/kafka-logs-1/data/kafka-logs-2

port =9092

broker server服务port

message.max.bytes =6525000

表示消息体的最大大小。单位是字节

num.network.threads =4

broker处理消息的最大线程数。普通情况下数量为cpu核数

num.io.threads =8

broker处理磁盘IO的线程数,数值为cpu核数2倍

background.threads =4

一些后台任务处理的线程数,比如过期消息文件的删除等,普通情况下不须要去做改动

queued.max.requests =500

等待IO线程处理的请求队列最大数,若是等待IO的请求超过这个数值。那么会停止接受外部消息,应该是一种自我保护机制。

host.name

broker的主机地址,若是设置了,那么会绑定到这个地址上,若是没有。会绑定到全部的接口上,并将当中之中的一个发送到ZK,一般不设置

socket.send.buffer.bytes=100*1024

socket的发送缓冲区。socket的调优參数SO_SNDBUFF

socket.receive.buffer.bytes =100*1024

socket的接受缓冲区。socket的调优參数SO_RCVBUFF

socket.request.max.bytes =100*1024*1024

socket请求的最大数值,防止serverOOMmessage.max.bytes必定要小于socket.request.max.bytes,会被topic创建时的指定參数覆盖

log.segment.bytes =1024*1024*1024

topic的分区是以一堆segment文件存储的。这个控制每一个segment的大小。会被topic创建时的指定參数覆盖

log.roll.hours =24*7

这个參数会在日志segment没有达到log.segment.bytes设置的大小。也会强制新建一个segment会被 topic创建时的指定參数覆盖

log.cleanup.policy = delete

日志清理策略选择有:deletecompact主要针对过期数据的处理,或是日志文件达到限制的额度。会被 topic创建时的指定參数覆盖

log.retention.minutes=300

log.retention.hours=24

数据文件保留多长时间, 存储的最大时间超过这个时间会依据log.cleanup.policy设置数据清除策略

log.retention.byteslog.retention.minutes或log.retention.hours随意一个达到要求,都会运行删除


有2删除数据文件方式:

      依照文件大小删除:log.retention.bytes

  依照2中不同一时候间粒度删除:分别为分钟,小时

log.retention.bytes=-1

topic每一个分区的最大文件大小,一个topic的限制大小 = 分区数*log.retention.bytes

-1没有大小限log.retention.byteslog.retention.minutes随意一个达到要求。都会运行删除,会被topic创建时的指定參数覆盖

log.retention.check.interval.ms=5minutes

文件大小检查的周期时间,是否处罚 log.cleanup.policy中设置的策略

log.cleaner.enable=false

是否开启日志清理

log.cleaner.threads = 2

日志清理执行的线程数

log.cleaner.io.max.bytes.per.second=None

日志清理时候处理的最大大小

log.cleaner.dedupe.buffer.size=500*1024*1024

日志清理去重时候的缓存空间。在空间同意的情况下,越大越好

log.cleaner.io.buffer.size=512*1024

日志清理时候用到的IO块大小一般不须要改动

log.cleaner.io.buffer.load.factor =0.9

日志清理中hash表的扩大因子一般不须要改动

log.cleaner.backoff.ms =15000

检查是否处罚日志清理的间隔

log.cleaner.min.cleanable.ratio=0.5

日志清理的频率控制。越大意味着更高效的清理。同一时候会存在一些空间上的浪费,会被topic创建时的指定參数覆盖

log.cleaner.delete.retention.ms =1day

对于压缩的日志保留的最长时间,也是client消费消息的最长时间,同log.retention.minutes的差别在于一个控制未压缩数据,一个控制压缩后的数据。会被topic创建时的指定參数覆盖

log.index.size.max.bytes =10*1024*1024

对于segment日志的索引文件限制大小,会被topic创建时的指定參数覆盖

log.index.interval.bytes =4096

当运行一个fetch操作后,须要一定的空间来扫描近期的offset大小,设置越大,代表扫描速度越快。可是也更好内存,普通情况下不须要搭理这个參数

log.flush.interval.messages=None

比如log.flush.interval.messages=1000

表示每当消息记录数达到1000时flush一次数据到磁盘

log文件”sync”到磁盘之前累积的消息条数,由于磁盘IO操作是一个慢操作,但又是一个数据可靠性"的必要手段,所以此參数的设置,须要在"数据可靠性""性能"之间做必要的权衡.假设此值过大,将会导致每次"fsync"的时间较长(IO堵塞),假设此值过小,将会导致"fsync"的次数较多,这也意味着总体的client请求有一定的延迟.物理server故障,将会导致没有fsync的消息丢失.

log.flush.scheduler.interval.ms =3000

检查是否须要固化到硬盘的时间间隔

log.flush.interval.ms = None

比如:log.flush.interval.ms=1000

表示每间隔1000毫秒flush一次数据到磁盘

只通过interval来控制消息的磁盘写入时机,是不足的.此參数用于控制"fsync"的时间间隔,假设消息量始终没有达到阀值,可是离上一次磁盘同步的时间间隔达到阀值,也将触发.

log.delete.delay.ms =60000

文件在索引中清除后保留的时间一般不须要去改动

log.flush.offset.checkpoint.interval.ms =60000

控制上次固化硬盘的时间点,以便于数据恢复一般不须要去改动

auto.create.topics.enable =true

是否同意自己主动创建topic,若是false,就须要通过命令创建topic

default.replication.factor =1

是否同意自己主动创建topic。若是false。就须要通过命令创建topic

num.partitions =1

每一个topic的分区个数,若是在topic创建时候没有指定的话会被topic创建时的指定參数覆盖



下面是kafkaLeader,replicas配置參数


controller.socket.timeout.ms =30000

partition leaderreplicas之间通讯时,socket的超时时间

controller.message.queue.size=10

partition leaderreplicas数据同步时,消息的队列尺寸

replica.lag.time.max.ms =10000

replicas响应partition leader的最长等待时间。若是超过这个时间,就将replicas列入ISR(in-sync replicas)。并觉得它是死的,不会再增加管理中

replica.lag.max.messages =4000

假设follower落后与leader太多,将会觉得此follower[或者说partition relicas]已经失效

##通常,followerleader通讯时,由于网络延迟或者链接断开,总会导致replicas中消息同步滞后

##假设消息之后太多,leader将觉得此follower网络延迟较大或者消息吞吐能力有限,将会把此replicas迁移

##到其它follower.

##broker数量较少,或者网络不足的环境中,建议提高此值.

replica.socket.timeout.ms=30*1000

followerleader之间的socket超时时间

replica.socket.receive.buffer.bytes=64*1024

leader复制时候的socket缓存大小

replica.fetch.max.bytes =1024*1024

replicas每次获取数据的最大大小

replica.fetch.wait.max.ms =500

replicasleader之间通信的最大等待时间,失败了会重试

replica.fetch.min.bytes =1

fetch的最小数据尺寸,假设leader中尚未同步的数据不足此值,将会堵塞,直到满足条件

num.replica.fetchers=1

leader进行复制的线程数,增大这个数值会添加followerIO

replica.high.watermark.checkpoint.interval.ms =5000

每一个replica检查是否将最高水位进行固化的频率

controlled.shutdown.enable =false

是否同意控制器关闭broker ,若是设置为true,会关闭全部在这个broker上的leader。并转移到其它broker

controlled.shutdown.max.retries =3

控制器关闭的尝试次数

controlled.shutdown.retry.backoff.ms =5000

每次关闭尝试的时间间隔

leader.imbalance.per.broker.percentage =10

leader的不平衡比例,若是超过这个数值,会对分区进行又一次的平衡

leader.imbalance.check.interval.seconds =300

检查leader是否不平衡的时间间隔

offset.metadata.max.bytes

client保留offset信息的最大空间大小

kafkazookeeper參数配置


zookeeper.connect = localhost:2181

zookeeper集群的地址,能够是多个,多个之间用逗号切割 hostname1:port1,hostname2:port2,hostname3:port3

zookeeper.session.timeout.ms=6000

ZooKeeper的最大超时时间,就是心跳的间隔,若是没有反映,那么觉得已经死了,不易过大

zookeeper.connection.timeout.ms =6000

ZooKeeper的连接超时时间

zookeeper.sync.time.ms =2000

ZooKeeper集群中leaderfollower之间的同步实际那





四、错误处理

1、配置kafka时,假设使用zookeeper create /kafka创建了节点。kafka与storm集成时new ZkHosts(zks) 须要改成 new ZkHosts(zks,”/kafka/brokers”),不然会报java.lang.RuntimeException: java.lang.RuntimeException: org.apache.zookeeper.KeeperException$NoNodeException: KeeperErrorCode = NoNode for /brokers/topics/my-replicated-topic5/partitions。



storm-kafka插件默认kafka的 zk_path例如以下:
public class ZkHosts implements BrokerHosts {
private static final String DEFAULT_ZK_PATH = “/brokers”;

2、假设出现下面问题,代表偏移量出错。建议又一次开一个topic
ERROR [KafkaApi-3] Error when processing fetch request for partition [xxxxx,1] offset 112394 from consumer with correlation id 0 (kafka.server.KafkaApis)
kafka.common.OffsetOutOfRangeException: Request for offset 112394 but we only have log segments in the range 0 to 665.  

3、当没有某个topic,或者是某个topic的node放置不在默认位置时,会有下面异常:
java.lang.RuntimeException: java.lang.RuntimeException: org.apache.zookeeper.KeeperException$NoNodeException: KeeperErrorCode = NoNode for /kafka/brokers/topics/mytest/partitions at storm.kafka.Dynam         


4、kafka中出现下面异常:
[2015-06-09 17:03:05,094] ERROR [KafkaApi-0] Error processing ProducerRequest with correlation id 616 from client kafka-client on partition [test3,0] (kafka.server.KafkaApis)
kafka.common.MessageSizeTooLargeException: Message size is 2211366 bytes which exceeds the maximum configured message size of 1000012.
原因是集群默认每次仅仅能接受约1M的消息。假设client一次发送的消息大于这个数值则会导致异常。
在server.properties中加入下面參数
message.max.bytes=1000000000
replica.fetch.max.bytes=1073741824
同一时候在consumer.properties中加入下面參数:
fetch.message.max.bytes=1073741824

然后重新启动kafka进程就可以。如今每次最大可接收100M的消息。


5、open too many files

kafka出现异常。日志提示open too many file
查找文件打开数量
lsof -p 30353 | wc
假设在1000以上。一般都是不正常,走过65535就会出错。
原因打开了太多producer,没关闭,调用producer.close()就可以。


五、经常使用操作
1、启动集群

bin/kafka-server-start.sh config/server.properties &

2、创建topic

bin/kafka-topics.sh --create --zookeeper 192.168.169.91:2181,192.168.169.92:2181,192.168.169.93:2181/kafka --replication-factor 3 --partitions 5 --topic test_topic

3、查看topic信息

bin/kafka-topics.sh --describe --zookeeper bin/kafka-console-producer.sh --broker-list  192.168.169.91:2181,192.168.169.92:2181,192.168.169.93:2181/kafka --topic test_topic

4、启动一个console producer。用于在console中模拟输入消息

bin/kafka-console-producer.sh --broker-list 192.168.169.92:9092, 192.168.169.93:9092, 192.168.169.94:9092 --topic test_topic

5、启动一个console consumer,用于模拟接收消息,并在console中输出

bin/kafka-console-consumer.sh --zookeeper 192.168.169.91:2181,192.168.169.92:2181,192.168.169.93:2181/kafka --from-beginning --topic test_topic


6、删除一个topic
bin/kafka-topics.sh  --zookeeper 192.168.169.91:2181,192.168.169.92:2181,192.168.169.93:2181/kafka --delete --topic test2

7、列出全部topic

 bin/kafka-topics.sh  --zookeeper localhost/kafka --list

 六、API


七、zookeeper中的内容

默认情况,kafka在zk的/brokers文件夹下记录topic相关的信息,但假设在创建topic时,指定了路径,则放置到固定的路径中。如:

bin/kafka-topics.sh --create --zookeeper 192.168.169.91:2181,192.168.169.92:2181,192.168.169.93:2181/kafka --replication-factor 3 --partitions 5 --topic test_topic
创建的topic,其相关信息会放置到/kafka/brokers中,这个文件夹中主要包含2个子文件夹:ids 和 topics

1、ids:记录这个kafka集群中有多少个broker

如:

ls /kafka/brokers/ids/
3   2   5   4

这个集群有4个节点,节点id分别为2,3,4。5。 我们看一下内容

[zk: localhost:2181(CONNECTED) 27] get  /kafka/brokers/ids/2
{"jmx_port":-1,"timestamp":"1435833841290","host":"kafka02-log.i.nease.net","version":1,"port":9092}
cZxid = 0x1000e8a68
ctime = Thu Jul 02 18:44:01 HKT 2015
mZxid = 0x1000e8a68
mtime = Thu Jul 02 18:44:01 HKT 2015
pZxid = 0x1000e8a68
cversion = 0
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x44e440d0bdf06eb
dataLength = 104
numChildren = 0
记录着这个节点的一些基本情况。

2、topics

先看一下有哪些内容:

[zk: localhost:2181(CONNECTED) 29] ls /kafka/brokers/topics/test30/partitions
[3, 2, 1, 0, 4]
[zk: localhost:2181(CONNECTED) 30] ls /kafka/brokers/topics/test30/partitions/0
[state]
[zk: localhost:2181(CONNECTED) 1] get /kafka/brokers/topics/test30/partitions/0/state
{"controller_epoch":4,"leader":5,"version":1,"leader_epoch":2,"isr":[5]}
cZxid = 0x100017c5e
ctime = Wed Jul 01 14:54:24 HKT 2015
mZxid = 0x1000e8a84
mtime = Thu Jul 02 18:44:01 HKT 2015
pZxid = 0x100017c5e
cversion = 0
dataVersion = 2
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 72
numChildren = 0
能够看某个分区的leader是哪个。从而读取kafka消息时。能够从这个leader中读取数据。




posted @ 2017-05-27 10:55  yfceshi  阅读(432)  评论(0编辑  收藏  举报