深入理解计算机系统:虚拟存储器
现代操作系统普遍采用虚拟存储器,说白了虚拟存储器是不真实存在的,是操作系统虚拟的,在磁盘上开辟的空间,该虚拟存储器可以在任何磁盘上。
1、虚拟存储器提供了三个重要的能力:
1.1、将主存看做是一个高速缓存,缓存最近使用的存放磁盘上的虚拟地址空间的内容,将虚拟地址与整个磁盘进行映射,主存中存储这种映射的页表,如果缺页,调入主存,存储器映射。
1.2、 为每一个进程提供了一致的地址空间,简化了连接、共享数据以及程序加载。
1.3、 保护每个进程的地址空间不被其他进程破坏。
2、在内存中,大体分为两种内容,除了给每个进程分配一定的虚拟地址之外,内存中还要维持一个内核虚拟存储器,在内核虚拟存储器中,包括与进程相关的数据机构(页表,任务结构等)、物理存储器和内核代码数据。在虚拟存储器中为每一个进程维持一个任务结构,以链表的形式表示进程的每一个区域。
3.1、页命中,收到虚拟地址时,根据该虚拟地址查找页表,如果有效位有效,则说明在内存中,则利用该地址构造物理地址。
3.2、缺页,如果地址不再页表中,则牺牲一条记录,加载进新的地址映射和内容。
4、在实际中,操作系统为每一个进程提供独立的页表,因此也是独立的虚拟地址空间,按需页面调度和独立的虚拟地址空间的结合,可以简化链接(可执行文件独立于物理存储器中代码和数据的最终位置,目标文件知道数据的相对位置,连接的时候,只需加上基地址即可)、简化加载(容易向存储器中加载可执行文件和共享对象文件,不需拷贝任何数据,虚拟存储器会自动按需调入数据页)、简化共享、简化存储器分配(只需虚拟地址连续即可,物理地址可以不连续)、保护工具(在PTE中,可以加许可位,控制对虚拟页面的访问)。
5、地址翻译:得到虚拟地址之后,分为两部分,前部分虚拟页号,后部分偏移地址,根据虚拟页号在页表中找到物理页号,偏移地址不变,直接物理页号和偏移地址构成物理地址。该模块位于cpu内。每次翻译虚拟地址时,都需要到内存访问页表,为了加快速度,在cpu内直接再弄一个缓存表,缓存TBE的内容,称为TLB。
6、翻译整个过程
地址翻译单元从虚拟地址中拿到虚拟页号,检查TLB,看是否存在TPE的缓存,如果有返回,若没有,查询主存的页表,页表可以实现多级,拿到物理页号,如没有产生中断,调入地址,内核重新发送解析指令,最终返回物理地址;得到物理地址之后,将物理地址发给L1缓存,L1没有L2、L3、主存。
7、存储器映射:将一个虚拟存储器区域与一个磁盘上的对象关联起来,以初始化这个虚拟存储器区域的内容,一旦一个虚拟页面被初始化了,他就在一个由内核维护的专门的交换文件之间换来换去。这个概念可以扩展到传统的文件系统,这样通过存储器的映射,高效的把数据加载到存储器中。
8、动态存储器分配:堆,分为显示分配(new),隐式分配(垃圾回收)。
9、Malloc原理,根据系统的对齐策略,进行分配,可以重复使用已经释放的地址。由于对齐可能产生内部碎片,由于重复使用,可能产生外部碎片。至于消除碎片的方法有很多,可采取维护空闲列表,不同的放置、分割、合并策略,在分配的时候采取首次适配、下一次适配和最佳适配。
10、垃圾收集:采用何种方式来辨别垃圾呐,系统采用的是图的方式进行,将存储器视为一张有向图,每个节点是根节点或堆节点,节点表示的一个分配块,如果在一个块中指向另一个块的某个位置,就连接,当存在一条从任意根节点出发并到达堆节点的有向路径时,视为可达,那些不可达的节点就是垃圾节点。再进行回收时,有两个阶段,标记和回收,标记垃圾节点,清除。
11、进程内存分布
参数
返回地址
bp
栈
共享
堆
bss:未初始化数据
data:全局,静态。
代码段
浙公网安备 33010602011771号