Ubuntu16.04配置单机版Zookeeper和Kafka
1. 配置zookeeper单机模式
选择的是zookeeper-3.4.10版本,官网下载链接:http://mirrors.hust.edu.cn/apache/zookeeper/stable/。下载之后将zookeeper-3.4.10.tar.gz解压到指定文件夹。
tar xvzf dl/zookeeper-3.4.10.tar.gz -C app/
解压之后,将conf/zoo_sample.cfg复制为conf/zoo.cfg。
cp $ZOOKEEPER_HOME/conf/zoo_sample.cfg $ZOOKEEPER_HOME/conf/zoo.cfg
然后编辑zoo.cfg,修改内容如下:
# /home/jason是我的用户主目录
dataDir=/home/jason/app/zookeeper/data
其他参数保持默认,若有特殊需求,也可进行修改。配置好后,手动创建dataDir目录。
mkdir /home/jason/app/zookeeper/data
若系统没有配置java环境变量,则需要在$ZOOKEEPER/bin/zkEnv.sh脚本中配置JAVA_HOME。在zkEnv.sh脚本的JAVA_HOME变量前面加上:
JAVA_HOME="/home/jason/app/jdk"
配置好后就可以启动zookeeper了:
./bin/zkServer.sh start
启动成功的日志如下:
ZooKeeper JMX enabled by default Using config: /home/jason/app/zookeeper/bin/../conf/zoo.cfg Starting zookeeper ... STARTED
需要结束服务时,仍在本目录下,执行如下命令即可:
./bin/zkServer.sh stop
如果需要自定义zookeeper的JVM配置,可以修改zkServer.sh脚本的JVMFLAGS参数,例如:
JVMFLAGS="-Xms128m -Xmx256m -Xmn64m -XX:PermSize=65m $JVMFLAGS"
修改后重启zookeeper,使用jmap -heap <pid>查看配置是否生效。
2.配置kafka单机模式
选择的是kafka_2.12-0.10.2.0版本,官网下载链接:http://mirrors.hust.edu.cn/apache/kafka/0.10.2.1/kafka_2.12-0.10.2.1.tgz 。下载之后将kafka_2.12-0.10.2.0.tgz解压到指定文件夹。
tar xvzf dl/kafka_2.12-0.10.2.0.tgz -C app/
配置kafka时需要修改2个配置文件:server.properties、zookeeper.properties,其他配置文件保持默认选项。
2.1. 配置server.properties
需要配置4项,其余保持默认值,如果kafka是部署在IAAS平台的话,后三个参数一定要配置,否则kafka客户端无法通过IAAS公网地址找到broker:
log.dirs=/home/jason/app/kafka/kafka-logs
port=9092
host.name=阿里云或腾讯云内网地址
advertised.host.name=阿里云或腾讯云外网映射地址
然后手动创建log.dirs目录:
mkdir /home/jason/app/kafka/kafka-logs
2.2. 配置zookeeper.properties
只需要配置一项,其余保持默认值:
dataDir=/home/jason/app/kafka/zookeeper/data
然后手动创建dataDir目录:
mkdir /home/jason/app/kafka/zookeeper/data
至此环境配置已经完成,然后可以开始使用kafka了。
3. 使用kafka
若系统没有配置java环境变量,则需要在$KAFKA/bin/kafka-run-class.sh脚本中配置JAVA_HOME。在kafka-run-class.sh脚本的JAVA_HOME变量前面加上:
JAVA_HOME="/home/jason/app/jdk"
3.1. 启动kafka服务(前提是要先启动zookeeper)
./bin/kafka-server-start.sh config/server.properties
对于这种启动之后就可以忽略的服务,可以在最前面加上nohup,让其在后台自己运行,或者:
/bin/kafka-server-start.sh -daemon config/server.properties
需要结束服务时,仍在本目录下,执行如下命令即可:
./bin/kafka-server-stop.sh
3.2. 创建话题topic
新开一个命令行窗口,创建一个叫做test的topic:
./bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test
然后可以根据地址和端口号将话题topic展示出来:
./bin/kafka-topics.sh --list --zookeeper localhost:2181
如果topic分区数需要扩展,可以通过下面命令:
./bin/kafka-topics.sh --zookeeper localhost:2181 --alter --topic test --partitions 10
查看kafka特定topic的详情,使用--topic与--describe参数:
./bin/kafka-topics.sh --zookeeper localhost:2181 --topic test --describe
删除指定Topic:
./bin/kafka-topics.sh --delete --zookeeper localhost:2181 --topic test Topic test is marked for deletion. Note: This will have no impact if delete.topic.enable is not set to true.
Note中指出该Topic并没有真正的删除,如果真删除,需要把server.properties中的delete.topic.enable置为true
3.3. 启动生产者producer
新开一个命令行窗口,执行以下命令:
./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test
然后可以之间在本窗口输入消息,每遇到换行符就认为是一条消息输入完成。
3.4. 启动消费者consumer
./bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning
然后,每在producer那里输入一条,consumer这里就会显示一条,然后kafka服务那里也会产生日志记录。
在以后启动时,只需要依次启动kafka server,producer和consumer就可以了。
查看consumer group列表,使用--list参数
查看consumer group列表有新、旧两种命令,分别查看新版(信息保存在broker中)consumer列表和老版(信息保存在zookeeper中)consumer列表,因而需要区分指定bootstrap--server和zookeeper参数:
./bin/kafka-consumer-groups.sh --new-consumer --bootstrap-server localhost:9292 --list test
./bin/kafka-consumer-groups.sh --zookeeper localhost:2181 --list console-consumer-86845 console-consumer-11967
查看特定consumer group 详情,使用--group与--describe参数
同样根据新/旧版本的consumer,分别指定bootstrap-server与zookeeper参数:
./bin/kafka-consumer-groups.sh --new-consumer --bootstrap-server localhost:9292 --group test --describe GROUP TOPIC PARTITION CURRENT-OFFSET LOG-END-OFFSET LAG OWNER lx_test test 0 465 465 0 kafka-python-1.3.1_/127.0.0.1
./bin/kafka-consumer-groups.sh --zookeeper localhost:2181 --group console-consumer-11967 --describe GROUP TOPIC PARTITION CURRENT-OFFSET LOG-END-OFFSET LAG OWNER Could not fetch offset from zookeeper for group console-consumer-11967 partition [lx_test_topic,0] due to missing offset data in zookeeper. console-consumer-11967 test 0 unknown 465 unknown console-consumer-11967_aws-lx-1513787888172-d3a91f05-0
其中依次展示group名称、消费的topic名称、partition id、consumer group最后一次提交的offset、最后提交的生产消息offset、消费offset与生产offset之间的差值、当前消费topic-partition的group成员id(不一定包含hostname)
上面示例中console-consumer-11967是为了测试临时起的一个console consumer,缺少在zookeeper中保存的current_offset信息。