摘要: 前言 在一个完整的离线大数据处理系统中,除了hdfs+mapreduce+hive组成分析系统的核心之外,还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统,而这些辅助工具在hadoop生态体系中都有便捷的开源框架,如图所示: 1. Flume日志采集框架 1.1 Flume介绍 1.1.1 阅读全文
posted @ 2018-11-02 16:12 _再遇见 阅读(1515) 评论(0) 推荐(0)