Flume原理

Flume概述

1.Flume简介

image-20230419093620398

image-20230419093937365


2.FLume概述

2.1 FLume介绍

image-20230419105455411

image-20230419095643022

2.2 Flume运行机制

image-20230419105218832

2.3 总结与思考⭐

  • FlumeAnget本质是一个JVM进程,包含三个组件:Source(采集器),Chanel(缓冲通道),Sink(接受器)
  • Flume-og由于代码臃肿被Flume-ng替代

3.Flume日志采集系统架构

image-20230606145200792

image-20230606145219443

image-20230606145240858

3.1 总结与思考⭐

  • 复杂结构即存在多个Agent,有两种情况,一是有多个数据源,而是有多个目的地

4.Flume的基本使用

4.1 Flume系统要求

image-20230423100313398

4.2 Flume安装配置

image-20230423100408871

1.Flume安装

image-20230423100641541

2.Flume配置

3. 总结与思考⭐
  • 先解压,再修改Flume-env.sh中和系统中的JAVA_HOME

4.3 Flume的入门和使用

1.配置Flume采集方案

2.使用指定采集方案启动Flume

启动Flume

3.Flume采集数据测试

image-20230423105615142

4.总结与思考⭐
  • 先编写配置文件,再指定配置文件启动FLumeAgent,再向监听端口发送数据5.

5.Flume采集方案配置说明

image-20230423110319314

5.1 Flume Source

1. AvroSource

2.Spooling Directoty Source

image-20230423112225674

3.Taildir Source

4.HTTP Source

image-20230423113014871

5.总结与思考⭐
  • AvroSource用于多个agent
  • Spooling Directory Souce用于监听新文件采集
  • Taildir Source用于监听文件新增内容采集
  • HTTP Source用于POST/GET请求接受event数据

5.2 Flume Channels

image-20230423141247254

1.Meory Chnanel

2.Flie Channel

image-20230423142349900

3.总结与思考⭐
  • MerryChannel适合更高容量吞吐,但是agent故障会丢失数据
  • FileChannel一次事务提交多个event,提高吞吐量,不会因故障丢失数据

5.3 FLume Sink

image-20230423142930001

1.HDFS Sink

![](/home/fubo/图片/HDFS SINK-1682233568066.png)

2.Logger Sink

image-20230423150829528

3.Avro Sink

image-20230423151058005

4.总结与思考⭐
  • 根据不通的目的地选择不同的sink

6.Flume的可靠性保证

image-20230423154803484

6.1 负载均衡

6.2 故障转移

image-20230423170203879

6.3 总结与思考⭐

  • 为了保证Flume可靠性,将单一的sink转换为sink group,通过多个sink来实现负载均衡,或再某个sink出现问题时,进行故障转移
  • load balancing sink processor(负载均衡sink处理器),让每个活跃的sink轮流/随即处理event
  • failover sink processor(故障转移sink处理器),只允许一个活跃且优先级高的sink处理event

7.Flume拦截器

Flume拦截器

总结与思考⭐

  • 拦截器是对event进行数据修改
  • Timestamp Intercepot(时间辍拦截器),会将timestamp-时间的键值对添加到header头部,以此记录流程发生的时间
  • Static Intercepot(静态拦截器):添加固定的键值对
  • Search and replace interceptors(查找替换拦截器):查询并添加键值对

8.案例-日志采集

8.1 案例分析

image-20230423173824677

8.2 案例实现

posted @ 2023-07-03 08:59  付十一。  阅读(17)  评论(0)    收藏  举报