Unix/Linux系统编程自学笔记-第十二章:块设备I/O和缓冲区管理
目录
概念介绍
-
块设备I/O缓冲区
用来代替磁盘I/O的文件存取方法,基本原理是使用一系列的I/O缓冲区作为块设备的缓存内存。当进程试图读取
(dev, blk)标识的磁盘块时,它首先在缓冲区缓存中搜索分配给磁盘块的缓冲区。如果该缓冲区存在并且包含有效数据,那么它只需从缓冲区中读取数据,而无须再次从磁盘中读取数据块。如果该缓冲区不存在,它会为磁盘块分配一个缓冲区,将数据读入缓冲区中,再从缓冲区中读取数据。当某个块被读入时,该缓冲区将被保存在缓冲区缓存中,以供任意进程对同一个块的下一次读/写请求使用。同样,当进程写入磁盘块时,它首先会获取一个分配给该块的缓冲区。然后,它将数据写入缓冲区,将缓冲区标记为脏,以延迟写人,并将其释放到缓冲区缓存中。由于脏缓冲区包含有效的数据,因此可以使用它来满足对同一块的后续读/写请求,而不会引起实际磁盘L/O。脏缓冲区只有在被重新分配到不同的块时才会写入磁盘。 -
基本定义
-
bread(dev , blk)函数
返回一个包含有效数据的缓冲区指针
BUFFER *bread(dev,blk) { BUFFER *bp =» getblk(dev,blk)} //get a buffer for(dev,blk) if (bp data valid) return bp; bp -> opcode = READ; //issue READ operation start_io(bp); wait for I/O complete; return bp; } -
write_block(dev , blk , data)函数
释放缓冲区
write_block(dev , blk , data) { BUFFER *bp = bread(dev , data) //write data for U space write data to bp; (synchronous write)? bwrite(bp) : dwrite(bp); }其中
bwrite(bp)表示同步写入,一般用于USB驱动器之类的设备。dwrite(bp)表示延迟写入,是随机访问设备如硬盘所使用的写操作方式,dwrite会将缓冲区标记为脏,脏缓冲区只有在被重新分配到不同的磁盘块时才会被写入磁盘。
-
物理块设备I/O
每个设备都有一个I/O队列,其中包含等待I/O操作的缓冲区。
缓冲区上的
start_io()操作如下:start_io(BUFFER *bp) { enter bp into device I/O queue; if (bp is first buffer in I/O queue) issue I/O command for bp to device; }当I/O操作完成后,设备中断处理程序会完成当前缓冲区上的I/O操作,并启动I/O队列中的下一个缓冲区的I/O。设备中断处理程序的算法如下:
InterruptHandler() { bp = dequeue(device I/O queue); //bp = remove head of I/O queue (bp -> opcode == ASYNC)? brelse(bp) : unblock process on bp; if (!empty(device I/O queue)) issue I/O command for first bp in I/O queue; }
-
Unix系统的 I/O缓冲区管理算法
- Unix系统的I/O缓冲区管理子系统一般有以下个5部分:
- I/O缓冲区:内核中的一系列NBUF缓冲区
- 设备表:每个块设备用一个设备表结构表示
- 缓存区初始化:系统启动时的I/O缓冲区都处在空闲列表,所有设备列表和I/O队列皆为空\
- 缓冲区列表:当缓冲区被分配给(dev , blk)时,插入设备列表的dev_list中
- Unix get/brelse算法:用于重新分配缓冲区
- Unix算法的缺点:
- 效率低下:该算法依赖于重试循环,例如,释放缓冲区可能会唤醒两组进程:需要释放的缓冲区的进程,以及只需要空闲缓冲区的进程。由于只有一个进程可以获取释放的缓冲区,所以,其他所有被唤醒的进程必须重新进入休眠状态。从休眠状态唤醒后,每个被唤醒的进程必须从头开始重新执行算法,因为所需的缓冲区可能已经存在。这会导致过多的进程切换。
- 缓存效果不可预知:在Unix算法中,每个释放的缓冲区都可被获取'如果缓冲区 由需要空闲缓冲区的进程获取,那么将会重新分配缓冲区,即使有些进程仍然需要当前的缓冲区。
- 可能会出现饥饿:Unix算法基于“自由经济”原则,即每个进程都有尝试的机会,但不能保证成功,因此,可能会出现进程饥饿。
- 该算法使用只适用于单处理器系统的休眠/唤醒操作
新的I/O缓冲区管理算法
-
Unix算法虽然简单,但也有许多缺点,所以需要一个更可靠的I/O缓冲区管理算法。这个新的算法即使用信号量的缓冲区管理算法。
-
使用信号量的缓冲区管理算法
使用P/V信号量实现进程同步的算法:
BUFFER *getb1k(dev,blk): while(1){(1). P(free); //get a free buffer first if (bp in dev_1ist){(2). if (bp not BUSY){ remove bp from freelist;P(bp); // lock bp but does not wait (3).return bp; // bp in cache but BUSY V(free); // give up the free buffer (4).P(bp); // wait in bp queue return bp;v // bp not in cache,try to create a bp=(dev,blk) (5).bp = frist buffer taken out of freelist;P(bp); // lock bp,no wait (6).if(bp dirty){ awzite(bp); // write bp out ASYNC,no wait continue; // continue from (1) (7).reassign bp to(dev,blk);1/ mark bp data invalid,not dir return bp;- // end of while(1); brelse(BUFFER *bp), { (8).iF (bp queue has waiter)( V(bp); return; ] (9).if(bp dirty && free queue has waiter){ awrite(bp);zeturn;}(10).enter bp into(tail of) freelist;V(bp);V(free); } -
P/V算法的正确性验证
- 缓冲区唯一
- 无重试循环
- 无不必要唤醒
- 缓存效果
- 无死锁或饥饿