第十二章学习笔记

第12章块设备I/O和缓冲区管理

12.1 块设备I/O缓冲区

读写普通文件的算法：

依赖于两个关键操作get_block 和 put_block，这两个操作将磁盘块读写到内存缓冲区中。

I/O缓冲的基本原理：

文件系统使用一系列I/O缓冲区作为块设备的缓存内存。当进程试图读取（dev，blk）标识的磁盘块时，他首先在缓冲区缓存中搜索分配给磁盘块的缓冲区。如果缓冲区中存在并且包含有效数据，那么它只需要从缓冲区中读取数据，而无需再次从磁盘中读取数据块。如果该缓冲区不存在，他会为磁盘块分配一个缓冲区，将数据从磁盘读入到缓冲区，然后从缓冲区读取数据。

当进程写入磁盘块时，他首先会获取一个分配给该块的缓冲区。然后将数据写入缓冲区，将缓冲区标记为脏，以延迟写入，并将起释放到缓冲区缓存中，并将其释放到缓冲区缓存中。

BUFFER缓冲区的结构类型（return bp；）

getblk（dev,blk）从缓冲区缓存中分配一个指定给（dev,blk）的缓冲区

bread（dev,blk）返回一个包含有效数据的缓冲区指针

brelse（bp）将缓冲区释放回缓冲区缓存

同步写入：用于顺序块或可移动设备，如USB驱动器。

延迟写入：对于随机访问设备，所有写操作都是延迟写操作。在延迟写操作中，dwrite(bp)将缓冲区标记为脏，并将其释放到缓冲区缓存中。

脏缓冲区只有在被重新分配到不同的磁盘块时才会被写入磁盘。

12.2 Unix I/O缓冲区管理算法

Unix缓冲区区管理子系统

（1）I/O缓冲区：内核中的一系列NBUF缓冲区用作缓冲区缓存。每一个缓冲区用结构体标识。

（2）设备表：每个块设备用一个设备表结构表示。

（3）缓冲区初始化：当系统启动时，所有I/O缓冲区都在空闲列表中，所有设备列表和I/O队列均为空。

（4）缓冲区列表：当缓冲区分配给（dev,blk）时，它会被插入设备表的dev_list中。如果缓冲区当前正在使用，则会将其标记为USY并从空闲列表中删除。繁忙缓冲区也可能回在设备表的I/O队列中。

（5）Unix getblk/brelse算法

Unix算法的具体说明

(1)数据一致性:为了确保数据一致性，getblk一定不能给同一个( dev, blk)分配多个缓冲区。这可以通过让进程从休眠状态唤醒后再次执行“重试循环”来实现。读者可以验证分配的每个缓冲区都是唯一的。其次，脏缓冲区在重新分配之前被写出来，这保证了数据的一致性。
(2）缓存效果:缓存效果可通过以下方法实现。释放的缓冲区保留在设备列表中，以便可能重用。标记为延迟写入的缓冲区不会立即产生IO，并且可以重用。缓冲区会被释放到空闲列表的末尾，但分配是从空闲列表的前面开始的。这是基于LRU(最近最少使用)原则,它有助于延长所分配缓冲区的使用期，从而提高它们的缓存效果。
(3)临界区:设备中断处理程序可操作缓冲区列表，例如从设备表的I/O队列中删除bp，更改其状态并调用brelse(bp)。所以，在getblk和 brelse中，设备中断在这些临界区中会被屏蔽。这些都是隐含的，但没有在算法中表现出来。

Unix算法的缺点

虽然Unix算法非常简单和简洁,但它也有以下缺点。
(1)效率低下;该算法依赖于重试循环。例如，释放缓冲区可能会唤醒两组进程:需要释放的缓冲区的进程，以及只需要空闲缓冲区的进程。由于只有一个进程可以获取释放的缓冲区，所以，其他所有被唤醒的进程必须重新进入休眠状态。从休眠状态唤醒后，每个被唤醒的进程必须从头开始重新执行算法，因为所需的缓冲区可能已经存在。这会导致过多的进程切换。
(2）缓存效果不可预知:在Unix算法中，每个释放的缓冲区都可被获取。如果缓冲区由需要空闲缓冲区的进程获取，那么将会重新分配缓冲区，即使有些进程仍然需要当前的缓冲区。
(3）可能会出现饥饿:Unix算法基于“自由经济”原则，即每个进程都有尝试的机会，但不能保证成功。因此,可能会出现进程饥饿。
(4)该算法使用只适用于单处理器系统的休眠/唤醒操作。-

12.3 新的I/O缓冲区管理算法

在信号量上使用P/V来实现进程同步，而不是使用休眠/唤醒。与休眠/唤醒相比，信号量的主要优点时：

(1)计数信号量可用来表示可用资源的数量，例如:空闲缓冲区的数量。
(2）当多个进程等待一个资源时，信号量上的V操作只会释放一个等待进程，该进程不必重试,因为它保证拥有资源。

使用信号量的缓冲区管理算法

假设有一个单处理器内核(一次运行一个进程)。使用计数信号量上的P/V来设计满足以下要求的新的缓冲区管理算法:
(1)保证数据一致性。
(2）良好的缓存效果。
(3）高效率:没有重试循环，没有不必要的进程“唤醒”。(4)无死锁和饥饿。

首先定义以下信号量

12.4 PV算法

empty[s2] = m;
full[s2] = 0;
 
while(1)//写进程
{
for(i = 0; i< s2; i++)
{
P(empty[i]);
}
P(mutex);
消息放入缓冲区；
V(mutex);
for(i = 0; i< s2; i++)
{
V(full[i]);
}
}
 
 
while(1)//读进程
{
P(full[i]);
P(mutex);
读取缓冲区；
V(mutex);
V(empty[i]);
}

【特点】：

(1)缓冲区唯一性。
(2)无重试循环。
(3)无不必要唤醒。
(4)缓存效果。

openeuler实践

perror ( )函数

perror(s) 用来将上一个函数发生错误的原因输出到标准设备(stderr)。参数 s 所指的字符串会先打印出，后面再加上错误原因字符串。此错误原因依照全局变量errno的值来决定要输出的字符串。

源代码：

运行截图

问题与解决思路

问题：为什么要设立输出缓冲区，直接输出结果不是更快么，而且这样还比较节省内存？

解答：为什么要有输入输出缓冲区

这篇博客中写到：数据缓冲是因为数据被输入后在处理的时候需要一定的时间，为了输入接着输出，需要缓冲，预先处理一部分信息，然后开始输出，在输出的同时处理后面的输入和处理。

问题：setbuf()函数和setvbuf()函数的区别是什么？

解答：setbuf()和setvbuf()函数的实际意义在于：用户打开一个文件后，可以建立自己的文件缓冲区，而不必使用fopen()函数打开文件时设定的默认缓冲区。这样就可以让用户自己来控制缓冲区，包括改变缓冲区大小、定时刷新缓冲区、改变缓冲区类型、删除流中默认的缓冲区、为不带缓冲区的流开辟缓冲区等。

详细链接：https://www.jb51.net/article/71720.htm

posted @ 2021-11-18 20:48 20191204李浩鹏阅读(91) 评论(0) 收藏举报

刷新页面返回顶部

20191204李浩鹏