Kafka种类介绍

一、种类介绍

1、Apache Kafka

Apache Kafka是最正宗的Kafka,也应该是你最熟悉的发行版本。自Kafka开源伊始,它便在Apache基金会孵化并最终毕业成为顶级项目,它也被称为社区版Kafka。

2、Confluent Kafka

2014年,Kafka的3个创始人Jay Kreps、Naha Narkhede和饶军离开LinkedIn创办了Confluent公司,专注于提供基于Kafka的企业级流处理解决方案。

2019年1月,Confluent公司成功融资D轮1.25亿美元,估值也达到了25亿美元,足见资本市场的青睐。

说回Confluent公司,它主要从事商业化Kafka工具开发,并在此基础上发布了Confluent Kafka。Confluent Kafka提供了一些Apache Kafka没有的高级特性,比如跨数据中心备份、Schema注册中心以及集群监控工具等。

3、Cloudera/Hortonworks Kafka

Cloudera提供的CDH和Hortonworks提供的HDP是非常著名的大数据平台,里面集成了目前主流的大数据框架,能够帮助用户实现从分布式存储、集群调度、流处理到机器学习、实时数据库等全方位的数据处理。不管CDH还是HDP里面都集成了Apache Kafka,因此把这两款产品中的Kafka称为CDH Kafka和HDP Kafka。

2018年10月两家公司宣布合并,共同打造世界领先的数据平台,也许以后CDH和HDP也会合并成一款产品,但肯定的是Apache Kafka依然会包含其中,并作为新数据平台的一部分对外提供服务。

二、优缺点对比

Kafka 优点 缺点 总结
Apache Kafka 开发人数最多、迭代速度最快

仅仅提供最最基础的组件,缺失一些高级的特性

Kafka Connect只提供一种连接器,即读写磁盘文件的连接器,而没有与其他外部系统交互的连接器

没有提供任何监控框架或工具

仅需要一个消息引擎系统,亦或是简单的流处理应用场景,同时需要对系统有较大把握度,那么推荐Apache Kafka
Confluent Kafka 集成了很多高级特性,且由Kafka原班人马打造,质量上有保证 相关文档资料不全,普及率低,没有太多可供参考的范例 如果需要用到Kafka的一些高级特性,那么推荐Confluent Kafka
CDH/HDP Kafka 操作简单,节省运维成本 把控度低,演进速度较慢 如果需要快速搭建消息引擎系统,或者需要搭建的是数据平台且Kafka只是其中的一个组件,那么推荐使用这些大数据云公司提供的Kafka
posted @ 2022-01-16 01:20  JavaIceman  阅读(303)  评论(0)    收藏  举报