摘要: 引言 Apache Flink 是一款用于大规模数据处理和分析的分布式流处理框架,它提供了高性能、容错性和灵活性,广泛应用于实时数据处理和批处理场景。Flink 的核心特性包括事件驱动、状态管理、窗口操作等,使其成为处理实时和离线数据的理想选择。 本文档将引导您在 YARN(Yet Another 阅读全文
posted @ 2023-12-24 17:22 sober_zero 阅读(990) 评论(0) 推荐(0)
摘要: HBase apache HBase™ 是 Hadoop 数据库,是一个分布式、可扩展的大数据存储。 当需要对大数据进行随机、实时的读/写访问时,请使用 Apache HBase™。 这个项目的目标是在商用硬件集群上托管非常大的表——数十亿行 X 数百万列。 Apache HBase 是一个开源的、 阅读全文
posted @ 2023-12-22 22:25 sober_zero 阅读(626) 评论(0) 推荐(0)
摘要: 什么是ClickHouse? ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。 它是一款开源的分布式列式数据库管理系统(DBMS),专为处理大规模数据分析而设计。它以高性能、可伸缩性和低延迟查询而著称,是俄罗斯搜索引擎公司Yandex开发的项目,于2016年开源。 阅读全文
posted @ 2023-12-20 22:05 sober_zero 阅读(607) 评论(0) 推荐(1)