云计算,分布式计算,网格计算,并行计算

现在把早上看到的云计算和分布式计算,网格计算,并行计算的概念对比分析一下。

其实是要了解云计算,但是这几个名字叫得容易把问题搞混。就先从关系最不大的说吧。

并行计算(Parallel Computing)

并行计算或称平行计算是相对于串行计算来说的;所谓并行计算可分为时间上的并行和空间上的并行。 时间上的并行就是指流水线技术,而空间上的并行则是指用多个处理器并发的执行计算。并行计算科学中主要研究的是空间上的并行问题。从程序和算法设计人员的角度来看,并行计算又可分为数据并行和任务并行。一般来说,因为数据并行主要是将一个大任务化解成相同的各个子任务,比任务并行要容易处理。

空间上的并行导致了两类并行机的产生,按照Flynn的说法分为:单指令流多数据流(SIMD)和多指令流多数据流(MIMD)。我们常用的串行机也叫做单指令流单数据流(SISD)。MIMD类的机器又可分为以下常见的五类:并行向量处理机(PVP)、对称多处理机(SMP)、大规模并行处理机(MPP)、工作站机群(COW)、分布式共享存储处理机(DSM)。

 

并行计算机有以下五种访存模型:均匀访存模型(UMA)、非均匀访存模型(NUMA)、全高速缓存访存模型(COMA)、一致性高速缓存非均匀存储访问模型(CC-NUMA)和非远程存储访问模型(NORMA)。

 

不像串行计算机那样,全世界基本上都在使用冯·诺伊曼的计算模型;并行计算机没有一个统一的计算模型。不过,人们已经提出了几种有价值的参考模型:PRAM模型,BSP模型,LogP模型,C^3模型等。(虽然上过高性能课,但是这几个模型都不清楚,很。。。。)

 

 

并行计算机是靠网络将各个处理机或处理器连接起来的,一般来说有以下几种方式:
静态连接:处理单元间有着固定连接的一类网络,在程序执行期间,这种点到点的链接保持不变;典型的静态网络有一维线性阵列、二维网孔、树连接、超立方网络、立方环、洗牌交换网、蝶形网络等。

动态连接:用交换开关构成的,可按应用程序的要求动态地改变连接组态;典型的动态网络包括总线、交叉开关和多级互连网络等。

 

 

节点度:射入或射出一个节点的边数。在单向网络中,入射和出射边之和称为节点度。
网络直径:网络中任何两个节点之间的最长距离,即最大路径数。
对剖宽度:对分网络各半所必须移去的最少边数。
对剖宽度:每秒钟内,在最小的对剖平面上通过所有连线的最大信息位(或字节)。

 

并行计算的性能度量

 

1,基本指标.

执行时间:

工作负载

存储性能

2,加速比评测.

Amdahl定理:

Gastofson定理:

Sun-Ni定理:

3,可扩放性标准.

等效率标准:

等速度标准

平均延迟标准:

 

这些在高性能课上老师都讲过,另附我不太喜欢这个老师。

 

刚才在并行计算部分已经提及分布式并行计算了,以我的理解分布式应该属于并行计算的一种,因为它是把任务分配到多机上然后一起执行。

 

所谓分布式计算是一门计算机科学,它研究如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计算机进行处理,最后把这些计算结果综合起来得到最终的结果。 最近的分布式计算项目已经被用于使用世界各地成千上万位志愿者的计算机的闲置计算能力。

 

分布式要解决的项目都很庞大,需要惊人的计算量,仅仅由单个的电脑或是个人在一个能让人接受的时间内计算完成是决不可能的。在以前,这些问题都应该由超级计算机来解决。但是, 超级计算机的造价和维护非常的昂贵,这不是一个普通的科研组织所能承受的。随着科学的发展,一种廉价的、高效的、维护方便的计算方法应运而生——分布式计算!

 

分布式计算是近年提出的一种新的计算方式。所谓分布式计算就是在两个或多个软件互相共享信息,这些软件既可以在同一台计算机上运行,也可以在通过网络连接起来的多台计算机上运行。分布式计算比起其它算法具有以下几个优点:

1、稀有资源可以共享,

2、通过分布式计算可以在多台计算机上平衡计算负载,

3、可以把程序放在最适合运行它的计算机上,

其中,共享稀有资源和平衡负载是计算机分布式计算的核心思想之一。

实际上,网格计算就是分布式计算的一种。如果我们说某项工作是分布式的,那么,参与这项工作的一定不只是一台计算机,而是一个计算机网络,显然这种“蚂蚁搬山”的方式将具有很强的数据处理能力。网格计算的实质就是组合与共享资源并确保系统安全。

分布式计算使用的操作系统包括分布式操作系统,网络操作系统,基于中间件的操作系统

 

其中分布式操作系统又包括多处理器系统和多机系统,这个应该很好理解,多处理器系统肯定只有一个操作系统,多机系统的分布式也是只有一个操作系统分配机器资源,这样的分布式系统机器与机器之间具有非常高的透明性,

而网络操作系统,基于中间件的操作系统,都是由多个计算机组成,每个计算机有独立 的操作系统。

这些分布式计算的区分还有通信方式,资源管理方式等不同,这里就先不说了,大家有兴趣可以查一下。另附上面一段是根据我的分布式课的课件写的,很感谢这位对自己要求严格,却很懂变通的老师。

 

上面已经说了,网格计算是分布式计算的一种,依照我现在的判断以上分布式操作系统除了多处理器分布式计算不是网格计算以外,其他的都可以称为网格计算。

 

网格计算是伴随着互联网而迅速发展起来的,专门针对复杂科学计算的新型计算模式。这种计算模式是利用互联网把分散在不同地理位置的电脑组织成一个“虚拟的超级计算机”,其中每一台参与计算的计算机就是一个“节点”,而整个计算是由成千上万个“节点”组成的“一张网格”,所以这种计算方式叫网格计算。这样组织起来的“虚拟的超级计算机”有两个优势,一个是数据处理能力超强;另一个是能充分利用网上的闲置处理能力。

 

 

下面终于轮到我们的主角云计算登场了。

 

云计算(Cloud computing),是一种新兴的共享基础架构的方法,可以将巨大的系统池连接在一起以提供各种IT服务。很多因素推动了对这类环境的需求,其中包括连接设备、实时数据流、SOA的采用以及搜索、开放协作、社会网络和移动商务等这样的Web2.0应用的急剧增长。 另外,数字元器件性能的提升也使IT环境的规模大幅度提高,从而进一步加强了对一个由统一的云进行管理的需求。云计算被它的吹捧者视为“革命性的计算模型”,因为它使得超级计算能力通过互联网自由流通成为了可能。企业与个人用户无需再投入昂贵的硬件购置成本,只需要通过互联网来购买租赁计算力,“把你的计算机当做接入口,一切都交给互联网吧”。

 

 

狭义云计算是指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的资源(硬件、平台、软件)。 提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。这种特性经常被称为像水电一样使用IT基础设施。

广义云计算是指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的服务。这种服务可以是IT和软件、互联网相关的,也可以使任意其他的服务。

 

 

云计算的特点

 

(1) 超大规模。“云”具有相当的规模,Google云计算已经拥有100多万台服务器, AmazonIBM微软Yahoo等的“云”均拥有几十万台服务器。企业私有云一般拥有数百上千台服务器。“云”能赋予用户前所未有的计算能力。

(2) 虚拟化。云计算支持用户在任意位置、使用各种终端获取应用服务。所请求的资源来自“云”,而不是固定的有形的实体。应用在“云”中某处运行,但实际上用户无需了解、也不用担心应用运行的具体位置。只需要一台笔记本或者一个手机,就可以通过网络服务来实现我们需要的一切,甚至包括超级计算这样的任务。

(3) 高可靠性。“云”使用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性,使用云计算比使用本地计算机可靠。

(4) 通用性。云计算不针对特定的应用,在“云”的支撑下可以构造出千变万化的应用,同一个“云”可以同时支撑不同的应用运行。

(5) 高可扩展性。“云”的规模可以动态伸缩,满足应用和用户规模增长的需要。

(6) 按需服务。“云”是一个庞大的资源池,你按需购买;云可以象自来水,电,煤气那样计费。

(7) 极其廉价。由于“云”的特殊容错措施可以采用极其廉价的节点来构成云,“云”的自动化集中式管理使大量企业无需负担日益高昂的数据中心管理成本,“云”的通用性使资源的利用率较之传统系统大幅提升,因此用户可以充分享受“云”的低成本优势,经常只要花费几百美元、几天时间就能完成以前需要数万美元、数月时间才能完成的任务。

 

以上都摘自一个叫互动的wiki里,现在web2.0的东西越来越多了,我们可以自己发布学习资料,很方便。然而所谓的高深的云计算不过是分布式计算,和web2.0技术的结合,当然还有发展了。它的技术成熟必将给我们带来很大的方便。

GoogleMap就是一个云计算服务,Google里有很多服务,用户如果想使用GoogleMap,只要上网找到它,Google公司的后台服务器便开始竭尽所能为你提供你所申请的map

并且非常快,这么快捷的服务,当然依赖于各种资源分配算法和分布式技术等等。有报道说GoogleMap有一天会变成收费的,虽然目前它是免费的。

云计算就是给我们承诺了一个这样的未来,我们可以不用在本地机器上安装软件,直接去网上就可以使用它。这样的好处当然是本地机器的处理能力不用很高,存储容量也不用很大就可以完成各种高难度的任务,如果你需要的话。比如不用安装环境,就可以在网上编程,然后把编的程序存在网上,客户端就得到了很大程度的解放。而且我们中国的公司也不用担心微软再向我们讨要什么版权费啥的。目前网上已经有了各种office工具,打击盗版的日子将随着云计算的普及消失。

 

当然无论如何我们平民大众都斗不过资本家,他们比猴都精,等人家让你尝够了云计算的好处,大家都开始使用网上服务以后,收费横空出世,大家先想着这个时候盗版也没辙了,咱们该怎么办,我们是不是要老实巴交的给别人交服务费,那 新一轮的资本主义压榨可就要开始了!!!!!!

 

由于最近看明朝那些事儿,感触颇多,说话都变成这种腔调了,请大家原谅。

另附书中谈及,钱老说他之所以研究出了这么大成果,是因为马列主义影响了他。(充分的说明哲学这东西很管用,不光教人实践与认知的辩证关系,还教人为人处世之道。)

 

写了好长,头很疼,眼也花了。

 

 

posted @ 2009-12-01 15:37  ninahan  阅读(...)  评论(... 编辑 收藏