虚拟存储器的三个重要功能:

  • 将主存看做是一个存储在磁盘上的地址空间的高速缓存,在主存中只保护活动区域。
  • 为每个进程提供了一致的地址空间,从而简化了存储器管理。
  • 保护了每个进程的地址空间不被其他进程破坏。

9.1 物理和普通寻址

  • 物理寻址:主存被组织成一个由M个连续的字节大小的单元组成的数组,依次类推的寻址方式称为物理寻址。

  • 虚拟寻址:CPU生成一个虚拟地址(VA)来访问主存,在被传送到存储器之前先转换成适当的物理地址。地址翻译通过CPU芯片上的存储器管理单元完成。

9.2 地址空间

地址空间是一个非负整数地址的有序集合:

{0,1,2,......}
  • 线性地址空间:地址空间中的整数是连续的。
  • 虚拟地址空间:CPU生成的虚拟地址。
  • 物理地址空间:与系统中的物理存储器的M个字节相对应。

9.3 虚拟存储器作为缓存的工具

VM系统将虚拟存储器分割为虚拟页,虚拟页面的集合分为三个不相交的子集:

  • 未分配的:系统还未分配的页,未存储数据,不占用磁盘空间。
  • 缓存的:当前缓存在物理存储器中的已分配页
  • 未缓存的:没有缓存在物理存储器中的已分配页。

页表

页表:将虚拟页映射到物理页,就是一个页表条目的数组。

PTE:由一个有效位和一个n位地址字段组成的,表明了该虚拟页是否被缓存在DRAM中。

页命中

当CPU读取一个字的时候,地址翻译硬件将虚拟地址作为一个索引来定位PTE,并从存储器中读取它。

缺页

  • 操作系统为每个进程提供了一个独立的页表,也就是一个独立的虚拟地址空间。
  • 抖个虚拟页面可以映射到同一个共享物理页面上。
  • 存储器映射:将一组连续的虚拟页映射到任意一个文件中的任意位置的表示法。

DRA缓存不命中称为缺页。在不命中发生时,换入页面的策略称为按需页面调度。

9.4 虚拟存储器作为存储器管理的工具

  • 操作系统为每个进程提供了一个独立的页表,也就是一个独立的虚拟地址空间。
  • 抖个虚拟页面可以映射到同一个共享物理页面上。
  • 存储器映射:将一组连续的虚拟页映射到任意一个文件中的任意位置的表示法。

9.5 虚拟存储器作为存储器保护的工具

  • SUP:表示进程是否必须运行在内核模式下才能访问该页
  • READ:读权限
  • WRITE:写权限

9.6 地址翻译

地址翻译是一个N元素的虚拟地址空间(VAS)中的元素和一个M元素的物理地址空间(PAS)之间的映射。

MAP:VAS→PAS∪空

MAP(A)=

  • A':如果虚拟地址A处的数据在PAS的物理地址A处'
  • 空:如果虚拟地址A处的数据不在物理存储器中

CPU中的一个控制寄存器页表基址寄存器指向当前页表,n位的虚拟地址包含两个部分:一个p位的虚拟页面偏移(VPO) 和一个(n-p)位的虚拟页号,页表条目中的物理页页号和虚拟地址中的VPO串联起来,就得到了相应的物理地址。

利用TLB加速地址翻译

在MMU中包括了一个关于PTE的小的缓存,称为翻译后备缓冲器(TLB),其中每一行都保存着一个由单个PTE组成的块。

  • CPU产生一个虚拟地址。
  • MMU从TLB中取出相对应的PTE。
  • MMU将这个虚拟地址翻译成一个物理地址,并将它发送到高速缓存/主存。
  • 高速缓存/主存将所请求的数据字返回给CPU。

多级页表

用来压缩页表的常用方法是使用层次结构的页表。

9.8 存储器映射

Linux通过将一个虚拟存储器区域与一个磁盘上的对象关联起来,以初始化这个虚拟存储器区域的内容,这个过程成为存储器映射。具体可以映射的对象有两种:

  • Unix文件系统中的普通文件。一个区域可以映射到一个普通磁盘文件的连续部分。
  • 匿名文件。匿名文件由内核创建,包含的全是二进制的0。

一旦一个虚拟页面被初始化了,它就在一个由内核维护的专门的交换文件之间换来换去。交换文件也叫交换空间,或交换区域。

共享对象

一个对象被映射到虚拟存储器的一个区域,要么作为共享对象,要么作为私有对象。

一个映射到共享对象的虚拟存储器区域叫做共享区域,类似的,也有虚拟区域。

私有对象时使用一种叫做写时拷贝的技术被映射到虚拟存储器中的,相应私有区域的页表条目都被标记为只读,并且区域结构被标记为私有的写时拷贝。

execve函数

使用execve函数将a.out程序加载到存储器的过程

Execve("a.out",NULL,NULL);

具体经过的步骤如下:

  • 删除已存在的用户区域。
  • 映射私有区域。
  • 映射共享区域。
  • 设置程序计数器。

    使用map函数的用户级存储器映射

Unix进程可以使用mmap函数来创建新的虚拟存储器区域,并将对象映射到这些区域当中

void *mmap(void *start,size_t length,int prot,int flags,int fd,off_t offest);
                        若成功则为指向映射区域的指针,若出错则为MAP_FAILDE(-1)

munmap函数删除虚拟存储器的区域。

int munmap(void *start,size_t length);
                        若成功则返回0,若失败则返回-1.

9.9 动态存储器分配

动态存储器分配器

当运行时需要额外虚拟存储器时,使用动态存储器分配器维护一个进程的虚拟存储器区域。分配器有两种风格。

  • 显示分配器:要求应用显式地释放任何已经分配的块。

  • 隐式分配器:要求分配器检测一个已分配块何时不再被程序所使用,就释放这个块。也叫做垃圾收集器。

malloc和free函数

C标准库提供了一个称为malloc程序包的显式分配器,程序通过调用malloc函数来从标准堆中分配块。

void *malloc(size_t size);
                若成功则为指针,若出错则为NULL。

通过调用free函数来释放已分配的块。

 void free(void *ptr);

分配器的目标和要求

显式分配器工作的约束条件:

  • 处理任意请求序列。
  • 立即响应请求。
  • 只使用堆。
  • 对齐块(对齐要求)。
  • 不修改已分配的额块。

理想分配器的目标:

  • 最大化吞吐率:吞吐率定义为每个单位时间里完成的请求数。
  • 最大化存储器利用率:最有用的标准是峰值利用率。

9.10 垃圾收集

垃圾收集器是一种动态存储分配器。,自动释放程序已经不再需要的已分配快(垃圾)。

垃圾收集器的基本知识

垃圾收集器将存储器视为一张有向可达图,图的节点被分配为一组根节点和一组堆节点。当存在一条从任意根节点出发到并到达P的有向路径时,就称节点P是可达的。

Mark&Sweep垃圾收集器

Mark&Sweep垃圾收集器由标记阶段和清除阶段组成,标记阶段标记出根节点所有可达的和已分配的后继,清除阶段释放每个未被标记的已分配块。

在对Mark&Sweep的描述中使用下列函数

  • ptr isPtr(ptr p):如果p指向一个已分配块中的某个字,那么就返回一个指向这个块起始位置的指针b,否则返回NULL。
  • int blockMarked(ptr b):如果已经标记了块b,就返回true。
  • int blockAllocated(ptr b):如果块b是已分配的,就返回true。
  • void markBlock(ptr b):标记块b。
  • int length(ptr b):返回块b的以字为单位的长度(不包括头部)。
  • void unmarkBlock(ptr b):将块b的状态由已标记的改为未标记的。
  • ptr nextBlock(ptr b):返回堆中块b的后继。

9.11 C语言中常见的与存储器有关的错误

  • 间接引用坏指针:在进程的虚拟地址空间中有较大的洞,没有映射到任何有意义的数据,如果试图引用一个指向这些洞的指针,操作系统就会以段异常来终止程序。典型的错误是:

    scanf("%d",val);

  • 读未初始化的存储器:虽然bass存储器位置总是被加载器初始化为0,但对于堆存储器却并不是这样的。

  • 允许栈缓冲区溢出:如果一个程序不检查输入串的大小就。写入栈中的目标缓冲区,程序就会出现缓冲区溢出错误。

  • 假设指针和指向他们的对象大小是相同的。

  • 造成错位错误。

  • 引用指针,而不是他所指向的对象。

  • 误解指针运算:忘记了指针的算术操作是以它们指向的对象的大小为单位来进行,而这种大小单位不一定是字节。

  • 引用不存在的变量。

  • 引用空闲堆块中的数据。

  • 引起存储器泄露:当不小心忘记释放已分配块,而在堆里创建了垃圾时,就会引起存储器泄露。