本文主要摘录了维基百科和网络上其他爱好者的文章。
实模式:
(Real mode)是Intel 80286和之后兼容CPU的操作模式。实模式的特性是一个20位的区段存储器地址空间(就是1M的存储器可以被寻址),可以直接软件访问BIOS例程意见周边硬件,没有任何硬件等级的存储器保护观念或多任务。所有的80286系列和之后的x86CPU都是以实模式下开机;80186和早期的CPU仅仅只有一种操作模式,也就是相当于后来芯片的这种实模式。
286架构导入保护模式,允许硬件等级的存储器保护。然而要是用这些新的特色,需要额外先前不需要的软件指令。由于x86微处理机主要的涉及规格,是能够完全向前兼容的。所有286芯片开机处于“ 实模式 ”,——关闭新的存储器保护特性的模式,可以运行原有的软件。IBM引进的PC-BIOS和DOS操作系统都是在实模式下工作。
保护模式:
(Protected Modo, pmode)是一种 80286 系列和之后的 x86 相容 CPU 操作模式。 保护模式有一些新特性,设计用来增强多任务和系统稳定度,比如内存保护,分页系统,以及硬件支持的虚拟内存。
另外一种 286 和其之后 CPU 的操作模式是 实模式,一种向前相容且关闭这些特色的模式。设计用来让新的芯片可以执行旧的软件。依照设计的规格,所有的 x86 CPU 都是在真实模式下开机,来确保传统操作系统的向前相容性。在任何保护模式的特色可用前,他们必须要由某些程式手动地切换到保护模式。在现今的电脑,这种切换通常是由操作系统在开机时候必须完成的第一件工作的一个。它也可能当 CPU 在保护模式下运行时,使用 虚拟86模式 来执行设计给真实模式的程式码。
实模式和保护模式的寻址机理:
实模式:寻址空间1M,这个地址空间由16位的段内地址和16位的段内偏移地址组成。
公式表示:物理地址=左移4位的段地址+偏移地址。
对于8086/8088来说计算实际地址是用绝对地址对1M求模。8086的地址线的物理结构:20根,也就是它可以物理寻址的内存范围为2^20个字节,即1 M空间,但由于8086/8088所使用的寄存器都是16位,能够表示的地址范围只有0-64K,这和1M地址空间来比较也太小了,所以为了在8086/8088下能够访问1M内存,Intel采取了分段寻址的模式:16位段基地址:16位偏移EA。其绝对地址计算方法为:16位基地址左移4位+16位偏移=20位地址。
比如:DS=1000H EA=FFFFH 那么绝对地址就为:10000H + 0FFFFH = 1FFFFH 地址单元 。通过这种方法来实现使用16位寄存器访问1M的地址空间,这种技术是处理器内部实现的,通过上述分段技术模式,能够表示的最大内存为:FFFFh:FFFFh=FFFF0h+FFFFh=10FFEFh=1M+64K-16Bytes(1M多余出来的部分被称做高端内存区HMA)。但8086/8088只有20位地址线,只能够访问1M地址范围的数据,所以如果访问100000h~10FFEFh之间的内存(大于1M空间),则必须有第21根地址线来参与寻址(8086/8088没有)。因此,当程序员给出超过1M(100000H-10FFEFH)的地址时,因为逻辑上正常,系统并不认为其访问越界而产生异常,而是自动从0开始计算,也就是说系统计算实际地址的时候是按照对1M求模的方式进行的,这种技术被称为wrap-around。
286的保护模式寻址:
286CPU的地址总线为24尾,寻址空间为4MB。而286寄存器仍为16位,寻址时,段寄存器保存的数据不再是内存物理地址,而是称作选择器(selector),其中高13位指向描述符表(descriptor table)的条目;最低的两位数据定义了请求的权限,从0到3,0是最高权限,3是最低权限。剩下的一位表示是使用全局描述符表GDT还是局部描述符表LDT。
描述符表的条目为8字节长,包括24位长的段其实物理地址,16位长的段长(因此段长从1B到216B ,即不超过64KB)。每次内存操作所要访问的物理地址为描述符表相应条目给出的24位段起始物理地址再加上16位的偏移量。可见,286保护模式下的应用程序能访问的内存线性地址空间仅为64 KB,非常有限。所以程序员编写使用大内存的应用程序时还必须使用远指针、近指针,相当繁琐。这影响了286保护模式的推广使用。
386的保护模式寻址:
地址总线为32比特,寻址空间为232(即4 GiB). 386 CPU保护模式下可以分页寻址;也可以非分页寻址而采取与286保护模式兼容的寻址方式,采用32位的选择器(selector)寄存器与32为的偏移量寄存器寻址,这时描述符表的条目中保存的段起始物理地址为32位,而段长的数据宽度为20位,但可以设置段长的粒度为1 B或4 KB,所以段的最大长度可以是1 MiB或者4 GB。
80286保护模式选址方式如下图:
80386保护模式的寻址方式:
下面我从一个网友那里找到的,很好的解释:
1:实模式:寻址采用和8086相同的16位段和偏移量,最大寻址空间1MB,最大分段64KB。可以使用32位指令。32位的x86 CPU用做高速的8086。
2:保护模式:寻址采用32位段和偏移量,最大寻址空间4GB,最大分段4GB (Pentium Pre及以后为64GB)。在保护模式下CPU可以进入虚拟8086方式,这是在保护模式下的实模式程序运行环境。第一:实模式下程序的运行回顾.
程序运行的实质是什么?其实很简单,就是指令的执行,显然CPU是指令得以执行的硬件保障,那么CPU如何知道指令在什么地方呢?
对了,80x86系列是使用CS寄存器配合IP寄存器来通知CPU指令在内存中的位置.
程序指令在执行过程中一般还需要有各种数据,80x86系列有DS、ES、FS、GS、SS等用于指示不同用途的数据段在内存中的位置。程序可能需要调用系统的服务子程序,80x86系列使用中断机制来实现系统服务。
总的来说,这些就是实模式下一个程序运行所需的主要内容(其它如跳转、返回、端口操作等相对来说比较次要。)
第二:保护模式---从程序运行说起
无论实模式还是保护模式,根本的问题还是程序如何在其中运行。因此我们在学习保护模式时应该时刻围绕这个问题来思考。
和实模式下一样,保护模式下程序运行的实质仍是“CPU执行指令,操作相关数据”,因此实模式下的各种代码段、数据段、堆栈段、中断服务程序仍然存在,且功能、作用不变。
那么保护模式下最大的变化是什么呢?答案可能因人而异,我的答案是“地址转换方式”变化最大。
第三:地址转换方式比较
先看一下实模式下的地址转换方式,假设我们在ES中存入0x1000,DI中存入0xFFFF,那么ES:DI=0x1000*0x10+0xFFFF=0x1FFFF,这就是众所周知的“左移4位加偏移”。
那么如果在保护模式下呢?假设上面的数据不变ES=0x1000,DI=0xFFFF,现在ES:DI等于什么呢? 公式如下:(注:0x1000=1000000000000b= 10 0000 0000 0 00)
ES:DI=全局描述符表中第0x200项描述符给出的段基址+0xFFFF
现在比较一下,好象是不一样。再仔细看看,又好象没什么区别! 为什么说没什么区别,因为我的想法是,既然ES中的内容都不是真正的段地址,凭什么实模式下称ES为“段寄存器”,而到了保护模式就说是“选择子”?
其实它们都是一种映射,只是映射规则不同而已:在实模式下这个“地址转换方式”是“左移4位”;在保护模式下是“查全局/局部描述表”。前者是系统定义的映射方式,后者是用户自定义的转换方式。而它影响的都是“shadow register”
从函数的观点来看,前者是表达式函数,后者是列举式函数:
实模式: F(es-->segment)={segment |segment=es*0x10}
保护模式:F(es-->segment)={segment |(es,segment)∈GDT/LDT}
其中GDT、LDT分别表示全局描述符表和局部描述符表。
第四:保护模式基本组成
保护模式最基本的组成部分是围绕着“地址转换方式”的变化增设了相应的机构。
1、数据段
前面说过,实模式下的各种代码段、数据段、堆栈段、中断服务程序仍然存在,我将它们统称为“数据段”,本文从此向下凡提到数据段都是使用这个定义。
2、描述符
保护模式下引入描述符来描述各种数据段,所有的描述符均为8个字节(0-7),由第5个字节说明描述符的类型,类型不同,描述符的结构也有所不同。
若干个描述符集中在一起组成描述符表,而描述符表本身也是一种数据段,也使用描述符进行描述。
从现在起,“地址转换”由描述符表来完成,从这个意义上说,描述符表是一张地址转换函数表。
3、选择子选择子是一个2字节的数,共16位,最低2位表示RPL,第3位表示查表是利用GDT(全局描述符表)还是LDT(局部描述符表)进行,最高13位给出了所需的描述符在描述符表中的地址。(注:13位正好足够寻址8K项)
有了以上三个概念之后可以进一步工作了,现在程序的运行与实模式下完全一样!!!各段寄存器仍然给出一个“段值”,只是这个“假段值”到真正的段地址的转换不再是“左移4位”,而是利用描述符表来完成。但现在出现一个新的问题是: 系统如何知道GDT/LDT在内存中的位置呢?
为了解决这个问题,显然需要引入新的寄存器用于指示GDT/LDT在内存中的位置。
在80x86系列中引入了两个新寄存器GDR和LDR,其中GDR用于表示GDT在内存中的段地址和段限(就是表的大小),因此GDR是一个48位的寄存器,其中32位表示段地址,16位表示段限(最大64K,每个描述符8字节,故最多有64K/8=8K个描述符)。LDR用于表示LDT在内存中的位置,但是因为LDT本身也是一种数据段,它必须有一个描述符,且该描述符必须放在GDT中,因此LDR使用了与DS、ES、CS等相同的机制,其中只存放一个“选择子”,通过查GDT表获得LDT的真正内存地址。
对了,还有中断要考虑,在80x86系列中为中断服务提供中断/陷阱描述符,这些描述符构成中断描述符表(IDT),并引入一个48位的全地址寄存器存放IDT的内存地址。理论上IDT表同样可以有8K项,可是因为80x86只支持256个中断,因此IDT实际上最大只能有256项(2K大小)。
第五:新要求---任务篇
前面介绍了保护模式的基本问题,也是核心问题,解决了上面的问题,程序就可以在保护模式下运行了。 但众所周知80286以后在保护模式下实现了对多任务的硬件支持。我的第一反应是:为什么不在实模式下支持多任务,是不能还是不愿?
思考之后,我的答案是:实模式下能实现多任务(也许我错了:))。因为多任务的关键是有了描述符,可以给出关于数据段的额外描述,如权限等,进而在这些附加信息的基础上进行相应的控制,而实模式下缺乏描述符,但假设我们规定各段的前2个字节或若干字节用于描述段的附加属性,我觉得和使用描述符这样的机制没有本质区别,如果再附加其他机制...
基于上述考虑,我更倾向于认为任务是独立于保护模式之外的功能。下面我们来分析一下任务。任务的实质是什么呢?很简单,就是程序嘛!!所谓任务的切换其实就是程序的切换!!
现在问题明朗了。实模式下程序一个接一个运行,因此程序运行的“环境”不必保存;保护模式下可能一个程序在运行过程中被暂停,转而执行下一个程序,我们要做什么?很容易想到保存程序运行的环境就行了(想想游戏程序的保存进度功能),比如各寄存器的值等。显然这些“环境”数据构成了一类新的数据段(即TSS)。延用前面的思路,给这类数据段设置描述符(TSS描述符),将该类描述符放在GDT中(不能放在LDT中,因为80x86不允许:)),最后再加一个TR寄存器用于查表。TR是一个起“选择子”作用的寄存器,16位。
好了,任务切换的基本工作就是将原任务的“环境”存入TSS数据段,更新TR寄存器,系统将自动查GDT表获得并装载新任务的“环境”,然后转到新任务执行。
第六:附加要求---分页篇
为什么叫附加要求,因为现在任务还不能很好地工作。前面说过,任务实质上是程序,不同的程序是由不同的用户写的,所有这些程序完全可能使用相同的地址空间,而任务的切换过程一般不会包括内存数据的刷新,不是不可能,而是如果那样做太浪费了。因此必须引入分页机制才可能有效地完成对多任务的支持。
分页引入的主要目标就是解决不同任务相互之间发生地址冲突的问题。分页的实质就是实现程序内地址到物理地址的映射,这也是一个“地址转换”机制,同样可以使用前面的方案(即类似GDT的做法):首先建立页表这样一种数据段,在80x86中使用二级页表方案,增设一个CR3寄存器用于存放一级页表(又称为页目录)在内存中的地址,CR3共32位,其低12位总是为零,高20位指示页目录的内存地址,因此页目录总是按页对齐的。CR3作为任务“环境”的一部分在任务切换时被存入TSS数据段中。
当然还得有相应的缺页中断机制及其相关寄存器CR2(页故障线性地址寄存器)。
第七:总结
保护模式下增加了什么?
1、寄存器 GDR LDR IDR TR CR3
2、数据段 描述符表(GDT LDT) 任务数据段(TSS) 页表(页目录 二级页表)
3、机制 权限检测(利用选择子/描述符/页表项的属性位) 线性地址到物理地址的映射
第八:保护模式常用名词解释
前面内容中出现过的不再解释。
1、RPL 选择子当中的权限位确定的权限
2、CPL 特指CS中的选择子当中的权限位确定的权限
3、EPL EPL=Max(RPL,CPL),即RPL和CPL中数值较大的,或说权限等级较小的
4、DPL 描述符中的权限位确定的权限
5、PL 泛指以上4种特权级
6、任务特权 =CPL
7、I/O特权 由EFLAGS寄存器的位13、14确定的权限
8、一致代码段 一种特殊的代码段,它在CPL>=DPL时允许访问
正常的代码段在CPL=DPL RPL<=DPL时才允许访问
参考文献地址(1):http://www.cublog.cn/u/16292/showart_303452.html
(2):http://www.cppblog.com/mydriverc/articles/30719.html
(3):http://zh.wikipedia.org/wiki/%E4%BF%9D%E8%AD%B7%E6%A8%A1%E5%BC%8F
(4):http://www.icrazyhack.cn/crazy-os-developer-notes-2-went-into-protection-mode/
浙公网安备 33010602011771号