文章分类 -  大数据工具

摘要:个人观点:大数据我们都知道hadoop,但并不都是hadoop.我们该如何构建大数据库项目。对于离线处理,hadoop还是比较适合的,但是对于实时性比较强的,数据量比较大的,我们可以采用Storm,那么Storm和什么技术搭配,才能够做一个适合自己的项目。下面给大家可以参考。可以带着下面问题来阅读本 阅读全文
posted @ 2017-03-06 15:17 程序员大V 阅读(2242) 评论(1) 推荐(1)
摘要:介绍性内容来自:http://www.uml.org.cn/sjjm/201305171.asp 一、Ganglia简介 Ganglia 是 UC Berkeley 发起的一个开源监视项目,设计用于测量数以千计的节点。每台计算机都运行一个收集和发送度量数据(如处理器速度、内存使用量等)的名为 gmo 阅读全文
posted @ 2017-03-06 15:06 程序员大V 阅读(106) 评论(0) 推荐(0)
摘要:在具体介绍本文内容之前,先给大家看一下Hadoop业务的整体开发流程: 从Hadoop的业务开发流程图中可以看出,在大数据的业务处理过程中,对于数据的采集是十分重要的一步,也是不可避免的一步,从而引出我们本文的主角—Flume。本文将围绕Flume的架构、Flume的应用(日志采集)进行详细的介绍。 阅读全文
posted @ 2017-03-06 15:00 程序员大V 阅读(135) 评论(0) 推荐(0)