Flume概览
1.Flume简介:
Flume is a distributed, reliable, and available service for efficiently collecting, aggregating, and moving large amounts of log data。
2.Flume处理流程

如图所示,Flume为了保证数据传送的高可靠性,在采集数据后会将数据缓存到Channel(硬盘或内存中),数据到达目的地或下一个Channel后会将缓存清除。传输的数据的基本单位是Event,如果是文本文件,通常是一行记录。
Flume内部自带了很多的Source、Channel和Sink。

浙公网安备 33010602011771号