云存储基础架构剖析

原文http://www.ibm.com/developerworks/cn/cloud/library/cl-cloudstorage/index.html
本文为其中部分段落内容。

 

  以目前数据增长的速度来看,云存储越来越流行不足为奇。增长速度最快的数据是归档数据,鉴于很多因素它是云存储的理想之选,这些因素包括成本、访问频率、保护和可用性。但是并非所有云存储都是相同的。一家提供商可能主要关注于成本,而另一家提供商关注于可用性或性能。没有一个架构具有单一侧重点,但是一个架构实现给定特征的程度定义了其市场和适当的使用模型。

 

通用架构

  云存储架构主要关乎以一个高度可扩展和多租户的方式按需交付存储。通用(参见 下图)的云存储架构包含一个导出 API 以访问存储的前端。在传统的存储系统中,这个 API 是 SCSI 协议;但是在云环境中,这些协议在演化。在那里您可以找到 Web 服务前端、基于文件的前端,甚至更多传统前端(比如 Internet SCSI 或 iSCSI)。在前端后面是一个中间件层,我将它称作存储逻辑。该层通过传统的数据放置算法(考虑地理布局)实现各种功能,比如复制和数据简缩。最后,后端实现对数据的物理存储。这可能是一个实现特定功能的内部协议或物理磁盘的一个传统后端。

通用的云存储架构

 

访问方法

  云存储与传统存储之间最显著的差异之一是其访问方法(参见 下图)。大部分提供商实现多个访问方法,但是 Web 服务 APIs 是常见的。许多 APIs 是基于 REST 原则实现的,即在 HTTP 之上开发(使用 HTTP 进行传输)的一种基于对象的方案。REST APIs 是无状态的,因此可以简单而有效地予以提供。许多云存储提供商实现 REST APIs,包括 Amazon Simple Storage Service (Amazon S3)、Windows Azure™ 和 Mezeo Cloud Storage Platform。

Web 服务 APIs 的一个问题是,它们需要与应用程序集成,以利用云存储。因此,对云存储也使用常见的访问方法来提供即时集成。例如,NFS/Common Internet File System (CIFS) 或 FTP 等基于文件的协议,iSCSI 等基于块的协议。Nirvanix、Zetta 和 Cleversafe 等云存储提供商提供这些访问方法。

尽管上面提到的协议是最常用的,但也有适合云存储的其他协议。最有趣的其中一个是基于 Web 的分布式创作与版本控制(WebDAV)。WebDAV 也基于 HTTP,且将 Web 作为一种可读写的资源加以启用。WebDAV 的提供商包括 Zetta 和 Cleversafe 等。

云存储访问方法

 

性能

  性能表现为很多方面,但是在用户与远程云存储提供商之间移动数据的能力是云存储最大的挑战。问题就是 TCP,它同时也是互联网的主力。TCP 基于数据包确认从对等端点控制数据流。数据包丢失或延迟到达情况下将启用阻塞控制,进一步限制性能以避免更多全局网络问题。TCP 适用于通过全局 Internet 启用小量数据,但不适用于会增加往返时间(RTT)的大型数据移动。

  通过 Aspera Software,Amazon 解决了这个问题,方法就是从程式中删除 TCP。且开发了一个称为 Fast and Secure Protocol(FASP™) 的新协议,以在大型 RTT 和严重数据包丢失情况下加速批量数据移动。关键是 UDP 的使用,它是 TCP 的缔约方传输协议。UDP 允许主机管理阻塞,将这个方面推进到 FASP 的应用层协议中。

Aspera Software 上的 Fast and Secure Protocol 

Aspera Software 上的 Fast and Secure        Protocol

 

云存储模型

  到目前为止,我主要谈讨了云存储提供商,但是还有云存储模型可支持用户控制其数据。云存储演化为三个类别,其中一个支持合并两个类别,以提供一个经济高效而安全的选择。

  本文大部分讨论了公共云存储提供商,它们将云存储基础架构作为可出租商品予以提供(从长期或短期存储和基础架构内使用的网络带宽角度来讲)。私有云使用公共云存储的概念,但是以可安全嵌入到用户防火墙内的形式。最后,混合云存储支持合并这两个模型,通过策略定义哪些数据必须私下维护,哪些可在公共云内得到安全维护。

云存储模型

 

前景展望

  云存储是云存储模型中的一个有趣进化,它重新定义我们在企业内构建、访问和管理存储的方式。尽管云存储目前主要是一种消费技术,它在迅速向企业质量方向演化。混合云存储模型将使企业能够在一个本地数据中心内维护其机密数据,同时委托更少的机密数据到云中,以实现成本节约和地域保护。查看 参考资料 获取有关云存储提供商和独特技术的信息的链接。

 

  • API:应用程序编程接口
  • FTP:文件传输协议
  • HTTP:超文本传输协议
  • HTTPS: 通过安全套接字层的 HTTP
  • JFS: 日志文件系统
  • NFS:网络文件系统
  • NIC:网络接口卡
  • RAID:独立磁盘冗余阵列
  • REST:具象状态传输
  • SAN:存储区域网络
  • SCSI:小型计算机系统接口
  • SLA:服务级别协议
  • TCP:传输控制协议
  • UDP:用户数据报协议
  • WAN:广域网

 

posted @ 2012-08-08 10:20  海角七号的Blog  阅读(702)  评论(1编辑  收藏  举报