Flume概览

1.Flume简介:

Flume is a distributed, reliable, and available service for efficiently collecting, aggregating, and moving large amounts of log data。

2.Flume处理流程

  如图所示,Flume为了保证数据传送的高可靠性,在采集数据后会将数据缓存到Channel(硬盘或内存中),数据到达目的地或下一个Channel后会将缓存清除。传输的数据的基本单位是Event,如果是文本文件,通常是一行记录。

Flume内部自带了很多的Source、Channel和Sink。

 

posted @ 2018-04-11 15:13  _fred  阅读(120)  评论(0)    收藏  举报