Hadoop 生态系统真庞大。今天看了 Flume,它是用来收集日志的。配置了一个简单的 Agent,把本地文件的内容实时采集到 HDFS 中。理解了 Source、Channel 和 Sink 的架构。感觉大数据处理的每一个环节都需要专门的工具。