《信息安全系统设计与实现》第十一周学习笔记

第十二章 块设备I/O和缓冲区管理

块设备I/O缓冲区

  • I/O缓冲的基本原理:文件系统使用一系列I/O缓冲区作为块设备的缓存内存。当进程试图读取(dev,blk)标识的磁盘块时。它首先在缓冲区缓存中搜索分配给磁盘块的缓冲区。如果该缓冲区存在并且包含有效数据、那么它只需从缓冲区中读取数据、而无须再次从磁盘中读取数据块。如果该缓冲区不存在,它会为磁盘块分配一个缓冲区,将数据从磁盘读人缓冲区,然后从缓冲区读取数据。当某个块被读入时、该缓冲区将被保存在缓冲区缓存中,以供任意进程对同一个块的下一次读/写请求使用。同样,当进程写入磁盘块时,它首先会获取一个分配给该块的缓冲区。然后,它将数据写入缓冲区,将缓冲区标记为脏,以延迟写入,并将其释放到缓冲区缓存中。由于脏缓冲区包含有效的数据,因此可以使用它来满足对同一块的后续读/写请求,而不会引起实际磁盘I/O。脏缓冲区只有在被重新分配到不同的块时才会写入磁盘。

Unix I/O缓冲区管理算法

  • I/O缓冲区:内核中的一系列NBUF 缓冲区用作缓冲区缓存。每个缓冲区用一个结构体表示。
typdef struct buf[
struct buf*next__free;// freelist pointer
struct buf *next__dev;// dev_list pointer int dev.,blk;
// assigmed disk block;int opcode;
// READ|wRITE int dirty;
// buffer data modified
int async;
// ASYNC write flag int valid;
//buffer data valid int buay;
// buffer is in use int wanted;
// some process needs this buffer struct semaphore lock=1; /
// buffer locking semaphore; value=1
struct semaphore iodone=0;// for process to wait for I/0 completion;// block data area char buf[BLKSIZE];)
} BUFFER;
BUFFER buf[NBUF],*freelist;// NBUF buffers and free buffer list

  • 设备表:每个块设备用一个设备表结构表示
struct devtab{
u16 dev;
// major device number // device buffer list BUFFER *dev_list;BUFFER*io_queue
// device I/0 queue ) devtab[NDEV];
}
  • 缓冲区初始化:当系统启动时,所有I/O缓冲区都在空闲列表中,所有设备列表和I/O队列均为空
  • 缓冲区列表
  • Unix getblk/brelse算法
BUFFER *getblk(dev,blk){
    while(1){
     search dev_list for a bp=(dev,blk);
     if (bp in dev_lst)
       if(bp BUSY)
          set bp WANTED flag;
          sleep(bp);
          continue;
           }
      take bp put of freelist;
      mark bp BUSY;
      return bp;
}
  • Unix算法的具体说明:
    1.数据的一致性;
    2.缓存效果;
    3.临界区。
  • Unix算法的缺点:
    1.效率低下;
    2.缓存效果不可预知;
    3.可能会出现饥饿;
    4.该算法使用只适用于单处理系统的休眠/唤醒操作。

新的 I/O 缓冲区管理算法

  • 信号量的主要优点
    1.计数信号量可用来表示可用资源的数量,例如:空闲缓冲区的数量。
    2.当多个进程等待一个资源时,信号量上的V操作只会释放一个等待进程,该进程不必重试,因为它保证拥有资源。
  • 使用计数信号量上的 P/V 来设计满足以下要求的新的缓冲区管理算法:
    1.保证数据一致性。
    2.良好的缓存效果。
    3.高效率:没有重试循环,没有不必要的进程“唤醒”。
    4.无死锁和饥饿。

注意,仅通过信号量上的 P/V 来替换 Unix 算法中的休眠/唤醒并不可取,因为这样会 保留所有的重试循环。我们必须重新设计算法来满足所有上述要求,并证明新算法的确优于 Unix算法。首先,我们定义以下信号量。

BUFFER buf[NBUF]; 		// NBUF I/O buffers
SEMAPHORE free = NBUF; 	// counting semaphore for FREE buffers
SEMAPHORE buf[i].sem = 1;	// each buffer has a lock sem=l;

为了简化符号,我们将用缓冲区本身来表示每个缓冲区的信号量。与 Unix 算法一样,最开始,所有缓冲区都在空闲列表中,所有设备列表和 I/O 队列均为空。

P/V算法

BUFFER *getblk(dev,blk)
{
    while(1){
  (1).      p(free);                              //首先获取一个空闲缓冲区
  (2).      if (bp in dev_list){                  //若该缓冲区在设备表的dev_list中
  (3).          if (bp not BUSY){                 //且处于空闲状态
                    remove from freelist;         //将其从空闲列表中删除
                    P(bp);                        //lock bp not wait
                    return bp;
                 }
            //若缓冲区存在缓存内且繁忙
                V(free);                          //放弃空闲缓冲区
  (4).          P(bp);                            //在缓冲队列中等待
                return bp;
           }
            //缓冲区不在缓存中,为磁盘创建一个缓冲区
  (5).     bp = first buffer taken out of freelist;
           P(bp);                             //lock bp no wait
  (6).     if (bp dirty){                     //若为脏缓冲区
              awrite(bp);                     //缓冲区写入磁盘
              continue;
           }
  (7).     reassign bp to (dev,blk);          //重新分配
           return bp;
      }
}
brelse (BUFFER *bp)
{
    (8).if (bp queue has waiter) {V(bp); return; }
    (9).if (bp dirty && freee queue has waiter){ awrite(bp); return;}
    (10).enter bp into (tail of) freelist; V(bp); V(free);
}
  • 证明PV算法是正确的:
    • 1.缓冲区唯一性:在 getblk()中,如果有空闲缓冲区,则进程不会在(1)处等待,而是会搜索 dev list。如果所需的缓冲区已经存在,则进程不会重新创建同一个缓冲区。如果所需的缓冲区不存在。则进程会使用个空闲缓冲区来创建所需的缓冲区。而这个空闲缓冲区保证是存在的。
    • 2.无重试循环:进程重新执行while(1)循环的唯一位置是在(6)处,但这不是重试,因为进程正在不断地执行。
    • 3.无不必要唤醒:在 getblk()中,进程可以在(1)处等待空闲缓冲区也可以在(4)处等待所需的缓冲区。在任意一种情况下,在有缓冲区之前,都不会唤醒进程重新运行。
    • 4.缓存效果:在 Unix算法中,每个释放的缓冲区都可被获取。而在新的算法中,始终保留含等待程序的缓冲区以供重用。只有缓冲区不含等待程序时,才会被释放为空闲。这样可以提高缓冲区的缓存效果。
    • 5.无死锁和饥饿:在 getblk()中,信号量锁定顺序始终是单向的,即 P(free),然后是P(bp),但决不会反过来,因此不会发生死锁。

实践

  • 1.setvbuf()函数实践

  • 2.perror()函数实践

遇到的问题及解决

  • 问题:Unix的缺点中提到的进程饥饿有什么含义?
  • 回答:

苏格拉底挑战

  • 1.块设备I/O缓冲区




  • 2.使用信号量的缓冲区管理算法