随笔档案「2019年1月22日」：大数据学习——flume日志分类采集汇总 ... - o_0的园子

2019年1月22日

摘要： 1. 案例场景 A、B两台日志服务机器实时生产日志主要类型为access.log、nginx.log、web.log 现在要求：把A、B 机器中的access.log、nginx.log、web.log 采集汇总到C机器上然后统一收集到hdfs中。但是在hdfs中要求的目录为： /source/ 阅读全文

posted @ 2019-01-22 22:52 o_0的园子阅读(1210) 评论(0) 推荐(1)

大数据学习——高可用配置案例

摘要：在完成单点的Flume NG搭建后，下面我们搭建一个高可用的Flume NG集群，架构图如下所示：（1）节点分配 Flume的Agent和Collector分布如下表所示：名称 Ip地址 Host 角色 Agent1 192.168.200.101 Itcast01 WebServer Coll 阅读全文

posted @ 2019-01-22 22:38 o_0的园子阅读(473) 评论(0) 推荐(0)

大数据学习——实现多agent的串联，收集数据到HDFS中

摘要：采集需求：比如业务系统使用log4j生成的日志，日志内容不断增加，需要把追加到日志文件中的数据实时采集到hdfs,使用agent串联根据需求，首先定义以下3大要素第一台flume agent l 采集源，即source——监控文件内容更新 : exec ‘tail -F file’ l 下沉目标阅读全文

posted @ 2019-01-22 22:23 o_0的园子阅读(615) 评论(0) 推荐(0)

大数据学习——flume拦截器

摘要： flume 拦截器(interceptor)1、flume拦截器介绍拦截器是简单的插件式组件，设置在source和channel之间。source接收到的事件event，在写入channel之前，拦截器都可以进行转换或者删除这些事件。每个拦截器只处理同一个source接收到的事件。可以自定义拦截器。阅读全文

posted @ 2019-01-22 21:13 o_0的园子阅读(3738) 评论(0) 推荐(0)

Notepad++ 连接远程 FTP

摘要： https://www.cnblogs.com/fangwu/p/8157590.html 阅读全文

posted @ 2019-01-22 20:50 o_0的园子阅读(207) 评论(0) 推荐(0)

大数据学习——采集文件到HDFS

摘要：采集需求：比如业务系统使用log4j生成的日志，日志内容不断增加，需要把追加到日志文件中的数据实时采集到hdfs 根据需求，首先定义以下3大要素 l 采集源，即source——监控文件内容更新 : exec ‘tail -F file’ l 下沉目标，即sink——HDFS文件系统 : hdfs s 阅读全文

posted @ 2019-01-22 20:44 o_0的园子阅读(1116) 评论(0) 推荐(0)