一、简介 Flume是一种分布式,可靠且可用的服务,用于有效地收集,聚合和移动大量日志数据。它具有基于流数据的简单灵活的架构、可靠的可靠性机制和许多故障转移和恢复机制,以及强大的容错性。它使用简单的可扩展数据模型,允许在线分析数据。很多大数据分析系统都通过flume来获取数据的输入。 Flume最早 Read More
一、主机信息(配置每个虚拟机的/etc/hosts文件) HostName IP ADDR bigdata111 192.168.1.111 bigdata112 192.168.1.112 bigdata113 192.168.1.113 二、JAVA及HADOOP环境变量配置 export JA Read More