Kafka种类介绍
一、种类介绍
1、Apache Kafka
Apache Kafka是最正宗的Kafka,也应该是你最熟悉的发行版本。自Kafka开源伊始,它便在Apache基金会孵化并最终毕业成为顶级项目,它也被称为社区版Kafka。
2、Confluent Kafka
2014年,Kafka的3个创始人Jay Kreps、Naha Narkhede和饶军离开LinkedIn创办了Confluent公司,专注于提供基于Kafka的企业级流处理解决方案。
2019年1月,Confluent公司成功融资D轮1.25亿美元,估值也达到了25亿美元,足见资本市场的青睐。
说回Confluent公司,它主要从事商业化Kafka工具开发,并在此基础上发布了Confluent Kafka。Confluent Kafka提供了一些Apache Kafka没有的高级特性,比如跨数据中心备份、Schema注册中心以及集群监控工具等。
3、Cloudera/Hortonworks Kafka
Cloudera提供的CDH和Hortonworks提供的HDP是非常著名的大数据平台,里面集成了目前主流的大数据框架,能够帮助用户实现从分布式存储、集群调度、流处理到机器学习、实时数据库等全方位的数据处理。不管CDH还是HDP里面都集成了Apache Kafka,因此把这两款产品中的Kafka称为CDH Kafka和HDP Kafka。
2018年10月两家公司宣布合并,共同打造世界领先的数据平台,也许以后CDH和HDP也会合并成一款产品,但肯定的是Apache Kafka依然会包含其中,并作为新数据平台的一部分对外提供服务。
二、优缺点对比
| Kafka | 优点 | 缺点 | 总结 |
| Apache Kafka | 开发人数最多、迭代速度最快 |
仅仅提供最最基础的组件,缺失一些高级的特性 Kafka Connect只提供一种连接器,即读写磁盘文件的连接器,而没有与其他外部系统交互的连接器 没有提供任何监控框架或工具 |
仅需要一个消息引擎系统,亦或是简单的流处理应用场景,同时需要对系统有较大把握度,那么推荐Apache Kafka |
| Confluent Kafka | 集成了很多高级特性,且由Kafka原班人马打造,质量上有保证 | 相关文档资料不全,普及率低,没有太多可供参考的范例 | 如果需要用到Kafka的一些高级特性,那么推荐Confluent Kafka |
| CDH/HDP Kafka | 操作简单,节省运维成本 | 把控度低,演进速度较慢 | 如果需要快速搭建消息引擎系统,或者需要搭建的是数据平台且Kafka只是其中的一个组件,那么推荐使用这些大数据云公司提供的Kafka |

浙公网安备 33010602011771号