数据库系统概论 第10章 数据库恢复技术

10.1 事务的基本概念

  • 在讨论数据库恢复技术之前先讲解事务的基本概念和事务的性质

1. 事务

  • 所谓事务是用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位。例如,在关系数据库中,一个事务可以是一条SQL语句、一组SQL语句和整个程序。
  • 事务和程序是两个概念。一般的讲,一个程序中包含多个事务。
  • 事务的开始和结束可以由用户显式控制。如果用户没有显式地定义事务,则由数据库管理系统默认规定自动划分事务。在SQL中,定义事务的语句一般有三条:
  1. BEGINTRANSACTION;
  2. COMMIT;
  3. ROLLBACK;
  • 事务通常是以BEGIN TRANSACTION开始,以COMMIT或ROLLBACK结束。COMMIT 表示提交,即提交事务的所有操作。具体地说就是事务中所有对数据库的更新写回到磁盘上的物理数据库中去,事务正常结束。ROOLBACK表示回滚,即在事务运行的过程中发生某种故障,事务不能继续执行,系统将事务中对数据库的所有已完成的操作全部撤销,回滚到事务开始的状态。这里的操作指对数据库的更新。

2.事务的ACID特性

  • 事务具有4个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持续性(Durability).这4个特性的简称为ACID特性(ACID properties)。
  • (1)原子性
  • 事务是数据库的逻辑工作单位,事务中包含的诸多操作要么都做,要么都不做。
  • (2)一致性
  • 事务执行的结果必须使数据库从一个一致性的状态变成另一个一致性的状态。因此当数据库只包含成功事务提交的结果时,就说数据库处于一致性状态。如果数据库系统运行中发生故障,有些事务尚未完成就被迫中断,这些未完成的事务对数据库所做的修改有一部分已写入物理数据库,这时数据库就处于不正确的状态,或者说是不一致的状态。例如,某公司在银行中有A,B两个账号,现在公司想从账号A 中取出一万元,存入账号B。那么就可以定义一个事务,该事务包括两种操作,第一个操作是从账号A中减去一万元,第二个操作是向账号B中加入一万元。这两个操作要么全做,要么全不做。全做或者全不做数据库都处于一致性的状态。如果只做了一个操作,则逻辑上就会发生错误,减少或者增加一万元,这时数据库就处于不一致性状态了。可见一致性与原子性是密切相关的。
  • 隔离性
  • 一个事务的执行不能被其它事务干扰。即一个事物的内部操作以及使用的数据的改变对其他并发事务是隔开的,并发执行的各个事务之间不能互相干扰。
  • 持续性
  • 持续性也成永久性(Permanence),指一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其他执行结果有任何影响。数据是恢复合并法控制的基本单位,所以下面的讨论均以事务为对象。保证事务的ACID特性是事务管理的重要任务。事务ACID特性可能遭到破坏的因素有;
  • (1)多个事务并行运行时,不同事务的操作交叉执行;
  • (2)事务在运行过程中强制停止。
  • 在第一种情况下,数据库管理系统必须保证多个事务的交叉运行不影响这些事务的原子性;在第二种情况下,数据库管理系统必须保证被强行终止的事务对数据库和其他事物没有任何影响。这就是数据库管理系统中恢复机制合并发控制机制的责任。

10.2 数据库恢复概述

  • 尽管数据库系统中采取了各种保护措施来防止数据库的安全性和完整性被破坏,保证并发事务的正确执行,但是计算机系统中硬件的故障、软件的错误、操作员的失误以及恶意的破坏任是不可避免的,这些故障轻则造成运行事务非正常中断,影响数据库中数据的正确性,重则破坏数据库,使数据库中全部或部分数据丢失。因此数据库管理系统必须具有把数据从错误状态恢复到某一已知的正确状态(亦称为一致状态或完整状态)的功能,这就是数据库的恢复。恢复子系统的数据库管理系统的一个重要组成部分,而且还相当庞大,常常占整个系统代码的10%以上。数据库系统所采用的的恢复技术是否行之有效,不仅对系统的可靠程度起着决定性作用,而且对系统的运行效率有很大影响,是衡量系统性能优劣的重要指标。

10.3 故障的分类

  • 数据库系统中可能发生各种各样的故障,大致可以分为以下几类。
  • 1.事物内部的故障
  • 事务内部的故障有的是可以通过事务程序本身发现的(见下面转账事务的例子),有的是非预期的,不能由事务程序处理。
  • 例如,银行转账事务,这个事务把一笔金额从另一个账户甲转给另一个账户乙。
    BEGIN TRANSACTION
        读账户甲的余额BALANCE;
        BALANCE=BALANCE-AMOUNT;                /*AMOUNT 为转账金额*/
        IF(BALANCE<0)THEN
            {打印'余额不足,不能转账';             /*事务内部可能造成事务被回滚的情况*/
            ROLLBACK;}                         /*撤销刚才的修改,恢复事务*/
        ELSE
            {读账户乙的余额 BALANCE1;          
            BALANCE1=BALANCE1-AMOUNT; 
            写回BALANCE1;
            COMMINT;}
  • 这个例子所包含的两个更新操作要么全部完成,要么全部不做,否则就会使数据库处于不一致的状态,例如可能出现只把账户甲的余额减少而没有把账户乙的余额增加的情况。
  • 在这段程序中若产生账户甲余额不足的情况,应用程序可以发现并让事务回滚,撤销已做的修改,恢复数据库到正确的状态。
  • 事务内部更多的故障是非预期的,是不能由应用程序处理的。如运算溢出、并发事务发生死锁而被选中撤销该事务、违反了某些完整性限制而被终止等。本书后内容中,事务故障仅指这类非预期的故障。
  • 事务故障意味着事务没有达到预期的终点(COMMIT或者显式的ROLLBACK),因此,数据库可能处于不正确的状态。恢复程序要在不影响其他事务运行的情况下,强行回滚该事务,即撤销该事务已经作出的任何对数据库的修改,使得该事务根本没有启动一样。这类恢复操作称为事务撤销(UNDO)。