随笔分类 -  Flume

摘要:脚本生产数据 >flume采集数据 >kafka消费数据 >storm集群处理数据 日志文件使用log4j生成,滚动生成! 当前正在写入的文件在满足一定的数量阈值之后,需要重命名!!! flume+Kafka整合步骤及相关配置:(先安装好zookeeper集群和Kafka集群) 配置flume: 1 阅读全文
posted @ 2017-06-19 15:07 ahu-lichang 阅读(1529) 评论(0) 推荐(0)
摘要:flume介绍 Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 Flume可以采集文件,socket数据包等各种形式源数据,又可以将采集到的数据输出到HDFS、hbase、hive、kafka等众多外部存储系统中 一般的采集需求,通过对flume的简单配置即可实现 Flum 阅读全文
posted @ 2017-05-08 22:06 ahu-lichang 阅读(675) 评论(0) 推荐(0)
摘要:1.flume是分布式的日志收集系统,把收集来的数据传送到目的地去。2.flume里面有个核心概念,叫做agent。agent是一个java进程,运行在日志收集节点。通过agent接收日志,然后暂存起来,再发送到目的地。3.agent里面包含3个核心组件:source、channel、sink。 3 阅读全文
posted @ 2017-04-10 11:31 ahu-lichang 阅读(538) 评论(0) 推荐(0)