2019年1月22日
摘要: 1. 案例场景 A、B两台日志服务机器实时生产日志主要类型为access.log、nginx.log、web.log 现在要求: 把A、B 机器中的access.log、nginx.log、web.log 采集汇总到C机器上然后统一收集到hdfs中。 但是在hdfs中要求的目录为: /source/ 阅读全文
posted @ 2019-01-22 22:52 o_0的园子 阅读(1170) 评论(0) 推荐(1) 编辑
摘要: 在完成单点的Flume NG搭建后,下面我们搭建一个高可用的Flume NG集群,架构图如下所示: (1)节点分配 Flume的Agent和Collector分布如下表所示: 名称 Ip地址 Host 角色 Agent1 192.168.200.101 Itcast01 WebServer Coll 阅读全文
posted @ 2019-01-22 22:38 o_0的园子 阅读(441) 评论(0) 推荐(0) 编辑
摘要: 采集需求:比如业务系统使用log4j生成的日志,日志内容不断增加,需要把追加到日志文件中的数据实时采集到hdfs,使用agent串联 根据需求,首先定义以下3大要素 第一台flume agent l 采集源,即source——监控文件内容更新 : exec ‘tail -F file’ l 下沉目标 阅读全文
posted @ 2019-01-22 22:23 o_0的园子 阅读(571) 评论(0) 推荐(0) 编辑
摘要: flume 拦截器(interceptor)1、flume拦截器介绍拦截器是简单的插件式组件,设置在source和channel之间。source接收到的事件event,在写入channel之前,拦截器都可以进行转换或者删除这些事件。每个拦截器只处理同一个source接收到的事件。可以自定义拦截器。 阅读全文
posted @ 2019-01-22 21:13 o_0的园子 阅读(3634) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/fangwu/p/8157590.html 阅读全文
posted @ 2019-01-22 20:50 o_0的园子 阅读(199) 评论(0) 推荐(0) 编辑
摘要: 采集需求:比如业务系统使用log4j生成的日志,日志内容不断增加,需要把追加到日志文件中的数据实时采集到hdfs 根据需求,首先定义以下3大要素 l 采集源,即source——监控文件内容更新 : exec ‘tail -F file’ l 下沉目标,即sink——HDFS文件系统 : hdfs s 阅读全文
posted @ 2019-01-22 20:44 o_0的园子 阅读(1095) 评论(0) 推荐(0) 编辑