本文共 3039 字,大约阅读时间需要 10 分钟。
Kafka 是一种高吞吐的分布式发布订阅消息系统,能够替代传统的消息队列用于解耦合数据处理,缓存未处理消息等,同时具有更高的吞吐率,支持分区、多副本、冗余,因此被广泛用于大规模消息数据处理应用。Kafka 支持 及多种其它语言客户端,可与、Storm、等其它工具结合使用。
主要介绍Kafka 在Centos 7上的安装和使用(window上类似),包括功能验证和集群的简单配置,配置很重要,很多流行的开源插件学会了配置感觉就可以直接用。
Kafka 使用Zookeeper 来保存相关配置信息,Kafka及Zookeeper 依赖Java 运行环境,从下载JDK 安装包,解压安装:
$mkdir java$tar zxvf jdk-8u65-linux-x64.tar.gz
进入普通用户的初始目录通过命令 ls -la 列出所有包含隐藏文件,找到配置文件.bash_profile 修改设置Java 环境变量:
export JAVA_HOME=/home/tmp/java/jdk1.8.0_151export PATH=$JAVA_HOME/bin:$PATH export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar
通过执行source命令使增加的环境变量生效,再验证java是否安装成功
$source .bash_profile$java -version
从下载Kafka 安装包,解压安装:
tar zxvf kafka_2.11-0.8.2.2.tgzmv kafka_2.11-0.8.2.2 kafkacd kafka
使用安装包中的脚本启动单节点Zookeeper 实例:
$./bin/zookeeper-server-start.sh -daemon ./config/zookeeper.properties[2018-05-19 04:26:59,585] INFO Reading configuration from: config/zookeeper.properties (org.apache.zookeeper.server.quorum.QuorumPeerConfig)....
使用kafka-server-start.sh 启动kafka 服务:
$./bin/kafka-server-start.sh ./config/server.properties[2018-05-19 04:28:56,115] INFO Verifying properties (kafka.utils.VerifiableProperties)[2018-05-19 04:28:56,141] INFO Property broker.id is overridden to 0 (kafka.utils.VerifiableProperties)
使用kafka-topics.sh 创建单分区单副本的topic test:
$ .$/bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic hellotopicCreated topic "hellotopic".
查看topic:
$./bin/kafka-topics.sh --list --zookeeper localhost:2181hellotopictesttest1
使用kafka-console-producer.sh 发送消息:
$ ./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic hellotopic>hello1>world1>kafka>
使用kafka-console-consumer.sh 接收消息并在终端打印:
$ ./bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic hellotopic --from-beginningUsing the ConsoleConsumer with old consumer is deprecated and will be removed in a future major release. Consider using the new consumer by passing [bootstrap-server] instead of [zookeeper].hello1world1kafka
利用单节点部署多个broker。 不同的broker 设置不同的 id,监听端口及日志目录。 例如:
cp config/server.properties config/server-1.properties
编辑配置:
config/server-1.properties: broker.id=1 port=9093 log.dir=/tmp/kafka-logs-1
启动Kafka服务:
bin/kafka-server-start.sh config/server-1.properties &
启动多个服务,按上文类似方式产生和消费消息,当用不同的broker生产者节点发送消息时,在消费者节点都可以看到消息,因为是单机版,所以IP默认为localhost,否则在配置文件底部像下面一样显式指定IP和端口:
broker.id=1zookeeper.connect=192.168.213.4:2181,192.168.213.5:2181listeners = PLAINTEXT://192.168.213.4:9092
多机多broker 集群配置
分别在多个节点按上述方式安装Kafka,配置启动多个Zookeeper 实例(zookeeper集群配置可参考另一篇文章https://blog.csdn.net/LZJLZJLZJLZJLZJLZJ/article/details/59090622)。 例如: 在10.4.253.22,10.4.253.23,10.4.253.24三台机器部署,Zookeeper配置如下:
initLimit=5syncLimit=2server.1=10.4.253.22:2888:3888server.2=10.4.253.23:2888:3888server.3=10.4.253.24:2888:3888
分别配置多个机器上的Kafka服务 设置不同的broke id,zookeeper.connect设置如下:
zookeeper.connect=10.4.253.22:2181,10.4.253.23:2181,10.4.253.24:2181
启动Zookeeper与Kafka服务,按上文方式产生和消费消息,验证集群功能。