随笔分类 -  Flume

摘要:一、简介 Flume是一种分布式,可靠且可用的服务,用于有效地收集,聚合和移动大量日志数据。它具有基于流数据的简单灵活的架构、可靠的可靠性机制和许多故障转移和恢复机制,以及强大的容错性。它使用简单的可扩展数据模型,允许在线分析数据。很多大数据分析系统都通过flume来获取数据的输入。 Flume最早 阅读全文
posted @ 2020-04-24 13:46 kwz 阅读(1295) 评论(0) 推荐(0)
摘要:目标:Flume实时监控目录sink到hdfs,再用sparkStreaming监控hdfs的这个目录,对数据进行计算 1、flume的配置,配置spoolDirSource_hdfsSink.properties,监控本地的一个目录,上传到hdfs一个目录下。 agent1.channels = 阅读全文
posted @ 2017-09-02 09:10 kwz 阅读(441) 评论(0) 推荐(0)