摘要:
1.背景随着互联网的高速发展,基于数据密集型应用的计算框架不断出现,从支持离线处理的MapReduce,到支持在线处理的Storm,从迭代式计算框架Spark到流式处理框架S4,…,各种框架诞生于不同的公司或者实验室,它们各有所长,各自解决了某一类应用问题。而在大部分互联网公司中,这几种框架可能都会... 阅读全文
posted @ 2015-07-03 17:04
lvyafei
阅读(1067)
评论(0)
推荐(0)
摘要:
本文是作者在充分阅读和理解Yahoo!最新发布的技术论文《S4:Distributed Stream Computing Platform》的基础上,所做出的知识分享。S4是Yahoo!在2010年10月开源的一套通用、分布式、可扩展、部分容错、具备可插拔功能的平台。这套平台主要是为了方便开发者开发... 阅读全文
posted @ 2015-07-03 16:47
lvyafei
阅读(815)
评论(0)
推荐(0)
摘要:
【编者的话】本文作者重点介绍了如何使用Docker、CoreOS、Mesos、Vulcand、对象存储来部署一个可扩展的Web应用,他首先介绍了为什么要选择这些工具以及与其它工具相比这些工具的优势。紧接着,他通过实际案例演示了整个部署过程,图文并茂,推荐阅读。介绍让我们先来讨论一下为什么我决定使用这... 阅读全文
posted @ 2015-07-03 16:14
lvyafei
阅读(660)
评论(0)
推荐(0)
摘要:
Hadoop首先看一下Hadoop解决了什么问题,Hadoop就是解决了大数据(大到一台计算机无法进行存储,一台计算机无法在要求的时间内进行处理)的可靠存储和处理。HDFS,在由普通PC组成的集群上提供高可靠的文件存储,通过将块保存多个副本的办法解决服务器或硬盘坏掉的问题。MapReduce,通过简... 阅读全文
posted @ 2015-07-03 15:16
lvyafei
阅读(357)
评论(0)
推荐(0)

浙公网安备 33010602011771号