Spring Kafka中关于Kafka的配置参数

来源于 https://www.cnblogs.com/miracleYu/p/10213807.html

 1 #################consumer的配置参数（开始）#################
 2 #如果'enable.auto.commit'为true，则消费者偏移自动提交给Kafka的频率（以毫秒为单位），默认值为5000。
 3 spring.kafka.consumer.auto-commit-interval;
 4  
 5 #当Kafka中没有初始偏移量或者服务器上不再存在当前偏移量时该怎么办，默认值为latest，表示自动将偏移重置为最新的偏移量
 6 #可选的值为latest, earliest, none
 7 spring.kafka.consumer.auto-offset-reset=latest;
 8  
 9 #以逗号分隔的主机：端口对列表，用于建立与Kafka群集的初始连接。
10 spring.kafka.consumer.bootstrap-servers;
11  
12 #ID在发出请求时传递给服务器;用于服务器端日志记录。
13 spring.kafka.consumer.client-id;
14  
15 #如果为true，则消费者的偏移量将在后台定期提交，默认值为true
16 spring.kafka.consumer.enable-auto-commit=true;
17  
18 #如果没有足够的数据立即满足“fetch.min.bytes”给出的要求，服务器在回答获取请求之前将阻塞的最长时间（以毫秒为单位）
19 #默认值为500
20 spring.kafka.consumer.fetch-max-wait;
21  
22 #服务器应以字节为单位返回获取请求的最小数据量，默认值为1，对应的kafka的参数为fetch.min.bytes。
23 spring.kafka.consumer.fetch-min-size;
24  
25 #用于标识此使用者所属的使用者组的唯一字符串。
26 spring.kafka.consumer.group-id;
27  
28 #心跳与消费者协调员之间的预期时间（以毫秒为单位），默认值为3000
29 spring.kafka.consumer.heartbeat-interval;
30  
31 #密钥的反序列化器类，实现类实现了接口org.apache.kafka.common.serialization.Deserializer
32 spring.kafka.consumer.key-deserializer=org.apache.kafka.common.serialization.StringDeserializer
33  
34 #值的反序列化器类，实现类实现了接口org.apache.kafka.common.serialization.Deserializer
35 spring.kafka.consumer.value-deserializer=org.apache.kafka.common.serialization.StringDeserializer
36  
37 #一次调用poll()操作时返回的最大记录数，默认值为500
38 spring.kafka.consumer.max-poll-records;
39 #################consumer的配置参数（结束）#################
40 #################producer的配置参数（开始）#################
41 #procedure要求leader在考虑完成请求之前收到的确认数，用于控制发送记录在服务端的持久化，其值可以为如下：
42 #acks = 0 如果设置为零，则生产者将不会等待来自服务器的任何确认，该记录将立即添加到套接字缓冲区并视为已发送。在这种情况下，无法保证服务器已收到记录，并且重试配置将不会生效（因为客户端通常不会知道任何故障），为每条记录返回的偏移量始终设置为-1。
43 #acks = 1 这意味着leader会将记录写入其本地日志，但无需等待所有副本服务器的完全确认即可做出回应，在这种情况下，如果leader在确认记录后立即失败，但在将数据复制到所有的副本服务器之前，则记录将会丢失。
44 #acks = all 这意味着leader将等待完整的同步副本集以确认记录，这保证了只要至少一个同步副本服务器仍然存活，记录就不会丢失，这是最强有力的保证，这相当于acks = -1的设置。
45 #可以设置的值为：all, -1, 0, 1
46 spring.kafka.producer.acks=1
47  
48 #每当多个记录被发送到同一分区时，生产者将尝试将记录一起批量处理为更少的请求， 
49 #这有助于提升客户端和服务器上的性能，此配置控制默认批量大小（以字节为单位），默认值为16384
50 spring.kafka.producer.batch-size=16384
51  
52 #以逗号分隔的主机：端口对列表，用于建立与Kafka群集的初始连接
53 spring.kafka.producer.bootstrap-servers
54  
55 #生产者可用于缓冲等待发送到服务器的记录的内存总字节数，默认值为33554432
56 spring.kafka.producer.buffer-memory=33554432
57  
58 #ID在发出请求时传递给服务器，用于服务器端日志记录
59 spring.kafka.producer.client-id
60  
61 #生产者生成的所有数据的压缩类型，此配置接受标准压缩编解码器（'gzip'，'snappy'，'lz4'），
62 #它还接受'uncompressed'以及'producer'，分别表示没有压缩以及保留生产者设置的原始压缩编解码器，
63 #默认值为producer
64 spring.kafka.producer.compression-type=producer
65  
66 #key的Serializer类，实现类实现了接口org.apache.kafka.common.serialization.Serializer
67 spring.kafka.producer.key-serializer=org.apache.kafka.common.serialization.StringSerializer
68  
69 #值的Serializer类，实现类实现了接口org.apache.kafka.common.serialization.Serializer
70 spring.kafka.producer.value-serializer=org.apache.kafka.common.serialization.StringSerializer
71  
72 #如果该值大于零时，表示启用重试失败的发送次数
73 spring.kafka.producer.retries
74 #################producer的配置参数（结束）#################
75 #################listener的配置参数（结束）#################
76 #侦听器的AckMode,参见https://docs.spring.io/spring-kafka/reference/htmlsingle/#committing-offsets
77 #当enable.auto.commit的值设置为false时，该值会生效；为true时不会生效
78 spring.kafka.listener.ack-mode;
79  
80 #在侦听器容器中运行的线程数
81 spring.kafka.listener.concurrency;
82  
83 #轮询消费者时使用的超时（以毫秒为单位）
84 spring.kafka.listener.poll-timeout;
85  
86 #当ackMode为“COUNT”或“COUNT_TIME”时，偏移提交之间的记录数
87 spring.kafka.listener.ack-count;
88  
89 #当ackMode为“TIME”或“COUNT_TIME”时，偏移提交之间的时间（以毫秒为单位）
90 spring.kafka.listener.ack-time;
91 #################listener的配置参数（结束）#################

一、线上问题

    出现Kafka手动提交失败，堆栈信息如下：

通过堆栈信息可以看出，有两个重要参数： session.timeout  和 max.poll.records

session.timeout.ms : 在使用Kafka的团队管理设施时，用于检测消费者失败的超时时间。消费者定期发送心跳来向经纪人表明其活跃度。如果代理在该会话超时到期之前没有收到心跳，那么代理将从该组中删除该消费者并启动重新平衡。

max.poll.records : 在一次调用poll（）中返回的最大记录数。

根据堆栈的提示，他让增加 session.timeout.ms 时间 或者 减少 max.poll.records。

总结：

1、 使用Kafka时，消费者每次poll的数据业务处理时间不能超过kafka的max.poll.interval.ms，该参数在kafka0.10.2.1中的默认值是300s,所以要综合业务处理时间和每次poll的数据数量。

2、Java线程池大小的选择，

对于CPU密集型应用，也就是计算密集型，线程池大小应该设置为CPU核数+1；

对于IO密集型应用 ，线程池大小设置为    2*CPU核数+1.

posted @ 2020-03-01 21:02 苦行者的刀阅读(6993) 评论(0) 收藏举报

刷新页面返回顶部

苦行者的刀

代码改变人生，有空就研究研究优秀的开源代码吧

Spring Kafka中关于Kafka的配置参数