备份技术发展简史:从磁带到云原生

摘要
备份技术的演进经历了从“冷介质”到“热数据”,从“搬运数据”到“管理数据”的转变。本文将备份技术发展划分为四个核心阶段:磁带时代、磁盘时代、重删与虚拟化时代、以及现代的CDM与云原生安全时代,深度解析每一次技术变革背后的驱动力。


第一阶段:蛮荒与磁带时代 (1950s - 1990s)

关键词:线性读写、物理搬运、Tar

在计算机发展的早期,硬盘极其昂贵且不可靠,备份是唯一的生存手段。

1. 穿孔卡片与早期磁带 (The Beginning)

  • 起源:最早的数据存储在穿孔卡片上,备份就是复制一箱卡片。
  • 1951年:UNIVAC I 计算机使用了 UNISERVO 磁带机,标志着磁带备份的开端。
  • 特点:顺序读写(Sequential Access)。要恢复磁带中间的一个文件,必须把磁带从头卷到中间,速度极慢。

2. Unix Tar 与 Dump

  • 1979年:Unix V7 发布了 tar (Tape ARchive) 命令。直到今天,Linux 系统管理员依然在使用 tar 命令打包文件。
  • 逻辑:完全基于文件系统层面的“打包”,不涉及任何复杂的增量追踪技术。

3. LTO 标准的诞生 (1990s)

  • 为了解决磁带格式混乱的问题,HP、IBM 和 Seagate 联合推出了 LTO (Linear Tape-Open) 技术。
  • 地位:LTO 凭借高容量、低成本和离线特性(Air Gap),奇迹般地活到了今天,依然是冷数据归档的首选。

第二阶段:磁盘备份与 SAN 网络的崛起 (1990s - 2005)

关键词:D2D、VTL、LAN-Free

随着互联网泡沫的出现,数据量激增,磁带的读写速度成为了瓶颈。企业开始用“硬盘”来备份“硬盘”。

1. D2D (Disk to Disk) 架构

  • 变革:由于硬盘价格下降,企业开始先将数据备份到廉价的磁盘阵列上,然后再在闲时转录到磁带(D2D2T)。
  • 优势:随机读写(Random Access)能力使得恢复速度有了质的飞跃。

2. VTL (Virtual Tape Library,虚拟磁带库)

  • 背景:当时的备份软件(如早期的 Veritas NBU)只认磁带库,不认磁盘阵列。
  • 技术:为了欺骗备份软件,存储厂商开发了 VTL。它在底层是磁盘阵列,但对外模拟成磁带库的接口(机械臂、磁带槽位)。
  • 评价:这是一个典型的“过渡性技术”,但在当时解决了兼容性大问题。

3. LAN-Free 备份

  • 痛点:早期的备份数据流走业务局域网(LAN),备份一跑,业务网络就瘫痪。
  • 方案:利用 SAN (存储区域网络) 光纤网络。备份数据直接从生产存储通过光纤交换机流向备份存储,不经过业务网络,极大释放了生产力。

第三阶段:效率革命——重删与虚拟化 (2005 - 2015)

关键词:重删、CBT、快照、无代理

这是备份技术技术含量爆发的十年。数据量从 TB 级迈向 PB 级,如果还在傻傻地拷贝文件,备份窗口(Backup Window)永远不够用。

1. 重复数据删除 (Deduplication) 的爆发

  • 里程碑Data Domain (后被 EMC 收购) 的出现改变了游戏规则。
  • 原理:它将数据切片并计算指纹。备份 10 个 Windows 系统,实际上只需要存储 1 份系统文件的空间。
  • 影响:备份存储需求量瞬间降低了 90%~95%,使得“全磁盘备份”在成本上终于击败了磁带。

2. 虚拟化备份的颠覆 (Veeam 的崛起)

  • 痛点:VMware 普及后,传统软件还在用“代理模式”在每个虚拟机里装 Agent,导致宿主机资源被耗尽(AV Storm)。
  • 技术突破
    • VADP (vStorage API for Data Protection):VMware 开放了底层接口。
    • CBT (Changed Block Tracking):不再扫描文件系统,直接问底层“哪些块变了”。
    • Agentless (无代理):Veeam 利用这些技术实现了无需进系统即可备份,迅速称霸。

3. 永久增量备份 (Incremental Forever)

  • 传统模式是“周全备+日增量”。现代软件通过合成全备技术,只需第一次做全备,之后永远只传增量数据,备份软件在后台默默合成,彻底解决了“备份窗口太长”的问题。

第四阶段:CDM、防勒索与云原生 (2015 - 至今)

关键词:即时恢复、数据复用、不可变、Kubernetes

备份不再仅仅是为了“兜底”,而是开始为业务创造价值(DevOps),并成为对抗黑客的最后堡垒。

1. CDM (Copy Data Management,副本数据管理)

  • 代表厂商:Actifio (被谷歌收购), Rubrik, Cohesity。
  • 理念转变备份 = 归档 -> 备份 = 数据服务
  • 技术:备份数据以原格式存储(非压缩包)。当开发测试需要数据时,直接通过 NFS/iSCSI 将备份镜像挂载给数据库服务器,实现分钟级的数据分发,无需漫长的 Restore 过程。

2. 防勒索与不可变备份 (Immutability)

  • 背景:勒索病毒(如 Wannacry)开始针对备份文件进行加密。
  • 技术WORM (Write Once Read Many) 技术从光盘和磁带回归到硬盘。通过对象存储的 Object Lock 或文件系统的特殊属性,保证备份文件在设定时间内“连管理员都删不掉”。

3. 云原生与容器备份

  • 挑战:Kubernetes 环境下,应用是动态的,Pod 随时在漂移。
  • 技术:以 Velero 为代表的工具,不再关注底层的机器,而是关注 K8s 的 NamespacePVC。备份变成了对 YAML 配置和持久化卷的快照。

总结:技术演进的逻辑

回顾这 70 年,备份技术的发展逻辑非常清晰:

  1. 介质层:从 离线磁带 -> 在线磁盘 -> 云对象存储/全闪存
  2. 数据流:从 CPU搬运 -> LAN传输 -> SAN直传 -> 存储直接快照
  3. 颗粒度:从 整个系统 -> 文件 -> 数据块 (Block) -> 应用对象 (Object)
  4. 目标:从 “防硬件故障” -> “防逻辑错误” -> “防勒索攻击”

未来的备份技术,将逐渐消失在基础设施中(Invisible Backup),成为存储和云平台自带的默认属性。

posted on 2026-01-04 14:28  LeeHang  阅读(11)  评论(0)    收藏  举报