SpringStrng

在校大三学生,大数据学习路线学习中 学习并记录总结有关大数据的内容

导航

2022年2月22日 #

Kafka学习记录

摘要: Kafka学习记录 定义 Kafka 是一个分布式的基于发布/订阅模式的消息队列(Message Queue),主要应用于 大数据实时处理领域。 为什么要用消息队列 1. 解耦 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束。 2. 可恢复性 系统的一部分组件失效时,不会影响到 阅读全文

posted @ 2022-02-22 15:08 SpringStrong 阅读(39) 评论(0) 推荐(0) 编辑

Flume学习记录

摘要: Flume 是 Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传 输的系统。Flume 基于流式架构,灵活简单。 Flume基础架构 Agent Agent 是一个 JVM 进程,它以事件的形式将数据从源头送至目的。 Agent 主要有 3 个部分组成,Source、C 阅读全文

posted @ 2022-02-22 13:56 SpringStrong 阅读(47) 评论(0) 推荐(0) 编辑

HBase学习记录

摘要: HBase学习记录 Day01 2022/2/22 为什么选择HBase HBase逻辑结构 HBase物理结构 HBase架构 HBase详细架构 HBase三层结构 HBase写流程 HBase读流程 为什么选择HBase 1、海量存储 Hbase适合存储PB级别的海量数据,在PB级别的数,能在 阅读全文

posted @ 2022-02-22 13:24 SpringStrong 阅读(133) 评论(0) 推荐(0) 编辑