随笔分类 - 大数据
摘要:CDH是什么,核心组件( 功能|组件类型|工作原理 )。 1、 CDH 是什么 CDH是Cloudera的100%开放源代码平台发行版,包括Apache Hadoop,是专门为满足企业需求而构建的。CDH可立即提供企业使用所需的一切。通过将Hadoop与十几个其他关键的开源项目集成在一起,Clo
阅读全文
摘要:Flume 是一个分布式、可靠、和高可用的海量日志采集、聚和和传输的系统。可以理解为一个Agent,分为 source、channel、sink 三部分,将 数据源 通过 管道 下沉到 目的地。 Kafka 是一个分布式事件流平台,用于数据 采集 与 下沉 之间的缓冲,是基于 发布/订阅 的 消息队
阅读全文

浙公网安备 33010602011771号