随笔分类 -  大数据

摘要:CDH是什么,核心组件( 功能|组件类型|工作原理 )。 1、 CDH 是什么 ​ CDH是Cloudera的100%开放源代码平台发行版,包括Apache Hadoop,是专门为满足企业需求而构建的。CDH可立即提供企业使用所需的一切。通过将Hadoop与十几个其他关键的开源项目集成在一起,Clo 阅读全文
posted @ 2022-07-04 10:15 anyiya 阅读(315) 评论(0) 推荐(0)
摘要:Flume 是一个分布式、可靠、和高可用的海量日志采集、聚和和传输的系统。可以理解为一个Agent,分为 source、channel、sink 三部分,将 数据源 通过 管道 下沉到 目的地。 Kafka 是一个分布式事件流平台,用于数据 采集 与 下沉 之间的缓冲,是基于 发布/订阅 的 消息队 阅读全文
posted @ 2022-06-29 16:06 anyiya 阅读(68) 评论(0) 推荐(0)