flume 参考文档 (一)

Flume配置文件(flume-site.conf)

 

1、 watchdog

watchdog.restarts.max

watchdog每分钟重启的最大数???

   

   

2、 common node

flume.config.heartbeat.period

node发送心跳周期,默认5000(毫秒)

flume.node.status.port

node web端口

flume.node.heartbeat.backoff.ceiling

node向master发送心跳之后等待反馈的最大时长,默认60000(毫秒)

flume.node.http.autofindport

如果已有node启动,允许第二个node自动选择一个未使用的端口做web服务。多个node的界面端口从35862、35863向后延续

   

   

3、agent

flume.agent.logdir

agent日志路径

flume.agent.logdir.maxage

当前处于打开状态agent日志文件收集信息的时长,在这之后该日志文件将会被关闭,并将数据发送到网络,默认10000(毫秒)

flume.agent.logdir.retransmit

在end-to-end模式下agent向collector发送数据失败后再次发送的间隔时长,默认60000(毫秒),建议至少是flume.collector.roll.millis的两倍

flume.agent.failover.backoff.initial

当primary sink(可以认为是第一collector)故障后,重启primary sink的一个延迟时间,在此期间,agent将把数据发送到secondary sink(可能是第二collector)

flume.agent.failover.backoff.max

在一定时限内尝试链接故障节点失败后,agent将把数据转发向备用节点

   

   

4、collector

flume.collector.event.host

默认collector地址

flume.collector.port

默认collector端口

flume.collector.dfs.dir

最终数据发向目录(默认),可以是本地,可以是hdfs,默认是/tmp

flume.collector.dfs.compress.codec

压缩格式GzipCodec, DefaultCodec (deflate), BZip2Codec,默认是None

flume.collector.roll.millis

hdfs文件切换(关闭后新建)的时长

flume.collector.output.format

collector发送数据格式avro, avrojson(默认), avrodata…

   

   

5、master

flume.master.servers

用逗号分隔多个master地址列表

flume.master.store

master配置存储方式(zookeeper/memory) zookeeper保证master的配置在多master节点之间同步,memory则保存在内存中,其配置随着master宕机而丢失

flume.master.serverid

master的唯一标识

flume.master.http.port

http端口

flume.master.heartbeat.missed.max

判断节点失效的最大未达心跳数

flume.master.savefile

当前flume配置文件的路径,默认conf/current.flume

flume.master.savefile.autoload

启动时是否加载current.flume,默认false

flume.master.gossip.period

master通信周期(毫秒)

flume.master.heartbeat.rpc

THRIFT/AVRO

flume.event.rpc

THRIFT/AVRO

flume.report.server.rpc.type

THRIFT/AVRO

   

   

6、zookeeper

flume.master.zk.logdir

zookeeper日志路径

   

   

7、thrift

flume.thrift.socket.timeout.ms

thrift网络连接超时时间(毫秒)

posted on 2011-05-18 20:46  张淼  阅读(6973)  评论(0编辑  收藏  举报