寄存器
一个典型的 CPU 由运算器、控制器、寄存器等器件组成,这些器件靠内部总线相连。内部总线实现 CPU 内部各个器件之间的联系,外部总线实现 CPU 和主板上其他器件的联系。简单地说,在 CPU 中:
- 运算器进行信息处理
- 寄存器进行信息存储
- 控制器控制各种器件进行工作
- 内部总线连接各种器件,在它们之间进行数据的传送。
对于一个汇编程序员来说,CPU 中的主要部件是寄存器。寄存器是 CPU 中程序员可以用指令读写的部件。程序员通过改变各种寄存器中的内容来实现对 CPU 的控制。
不同的 CPU,寄存器的个数、结构是不相同的。8086CPU 有14个寄存器,每个寄存器有一个名称。这些寄存器是:AX、BX、CX、DX、SI、DI、SP、BP、IP、CS、SS、DS、ES、PSW。
2.1 通用寄存器
8086CPU 的所有寄存器都是16位的,可以存放两个字节。AX、BX、CX、DX 这四个寄存器通常用来存放一般性数据,被称为通用寄存器。
一个 16 位寄存器所可以存储一个 16 位的数据。
8086CPU 的上一代 CPU 中的寄存器都是 8 位的,为了保证兼容,使原来基于上代 CPU 编写的程序稍加修改就可以运行在8086之上,8086CPU 的AX、BX、CX、DX这四个寄存器都可分为两个独立使用的 8 位寄存器来使用:
- AX 可分为 AH 和 AL;
- BX 可分为 BH 和 BL;
- CX 可分为 CH 和 CL;
- DX 可分为 DH 和 DL;
以AX为例,8086CPU 的 16 位寄存器中,AX的低 8 位(0 位 ~ 7 位)构成了 AL 寄存器,高 8 位(8 位 ~ 15 位)构成了 AH 寄存器。AH 和 AL 寄存器是可以独立使用的 8 位寄存器。
2.2 字在寄存器中的存储
出于对兼容性的考虑,8086CPU 可以一次性处理以下两种尺寸的数据。
- 字节:记为 byte,一个字节由 8 个 bit 组成,可以存放在 8 位寄存器中。
- 字:记为 word,一个字由两个字节组成,这两个字节分别称为这个字的高位字节和低位字节。
一个字可以存放在一个 16 位寄存器中,这个字的高位字节和低位字节自然就存在这个寄存器的高 8 位寄存器和低 8 位寄存器中。如上图所示,一个字型数据 20000,存在 AX 寄存器中,在 AH 中存储了它的高 8 位,在 AL 中存储了它的低 8 位。AH 和 AL 中的数据,既可以看成是一个字型数据的高 8 位和低 8 位,这个字型数据的大小是 20000;又可以看作是两个独立的字节型数据,它们的大小分别是 78 和 32。
2.3 几条汇编指令
在写一条汇编指令或一个寄存器的名称时不区分大小写。如 mov ax, 18 和 MOV AX, 18 的含义相同;bx 和 BX 的含义相同。
2.4 物理地址
我们知道,CPU 访问内存单元时,要给出内存单元的地址。所有的内存单元构成的存储空间是一个一维的线性空间,每一个内存单元在这个空间中都有唯一的地址,我们将这个唯一的地址称为物理地址。
2.5 16位结构的 CPU
16位结构(16 位机、字长为 16 位等说法,与 16 位结构的含义相同)具有以下几方面的结构特性:
- 运算器一次最多可以处理 16 位的数据
- 寄存器的最大宽度为 16 位
- 寄存器和运算器之间的通路为 16位
8086 是 16 位结构的 CPU,这也就是说,在 8086 内部,能够一次性处理、传输、暂时存储的信息的最大长度是 16 位的。内存单元的地址在送上地址总线之前,必须在 CPU 中处理、传输、暂时存放,对于 16 位 CPU,能一次性处理、传输、暂时存储 16 位的地址。
2.6 8086CPU 给出物理地址的方法
8086CPU 有 20 位地址总线,可以传送 20 位地址,达到 1MB 寻址能力。8086CPU 又是 16位结构,从 8086CPU 的内部结构来看,如果将地址从内部简单地发出,那么它只能送出 16 位的地址,表现出的寻址能力只有 64KB。
8086CPU 采用一种在内部用两个 16 位地址合成的方法来形成一个 20 位的物理地址。
如上图所示,当 8086CPU 要读写内存时:
(1)、CPU 中的相关部件提供两个 16 位的地址,一个称为段地址,另一个称为偏移地址;
(2)、段地址和偏移地址通过内部总线送入一个被称为地址加法器的部件;
(3)、地址加法器将两个 16 位地址合成为一个 20 位的物理地址;
(4)、地址加法器通过内部总线将 20 位物理地址送入输入输出控制电路;
(5)、输入输出控制电路将 20 位物理地址送上地址总线;
(6)、20 位物理地址被地址总线传送到存储器。
地址加法器采用 物理地址 = 段地址x16 + 偏移地址 的方法用段地址和偏移地址合成物理地址。段地址x16 有一个更为常用的说法是左移 4 位。计算机中的所有信息都是以二进制的形式存储的,段地址当然也不例外。机器只能处理二进制信息,左移4位 中的位,指的是二进制位。(2^4,2的四次方)。地址加法器就是通过将以二进制形式存放的段地址左移 4 位来完成段地址x16的运算的。
2.7 段地址 x 16 + 偏移地址 = 物理地址 的本质含义
“段地址x16 + 偏移地址 = 物理地址”的本质含义是:CPU 在访问内存时,用一个基础地址(段地址x16)和一个相对于基础地址的偏移地址相加,给出内存单元的物理地址。
更一般地说,8086CPU 这种寻址功能是“基础地址 + 偏移地址 = 物理地址”寻址模式的一种具体实现方案,8086CPU 中,段地址x16 可看做是基础地址。
2.8 段的概念
我们注意到,“段地址”这个名称中包含着“段”的概念。这种说法可能对一些学习者产生了误导,使人误以为内存被划分成了一个一个的段,每一个段有一个段地址。如果一开始就形成了这种认识,将影响以后对汇编语言的深入理解和灵活应用。
其实,内存并没有分段,段的划分来自于 CPU,由于 8086CPU 用“基础地址(段地址x16) + 偏移地址 = 物理地址”的方式给出内存单元的物理地址,使得我们可以用分段的方式来管理内存。
以后,在编程的时候可以根据需要,将若干地址连续的内存单元看作一个段,用 段地址x16 定位段的起始地址(基础地址),用偏移地址定位段中的内存单元。有两点需要注意:段地址x16 必然是 16 的倍数,所以一个段的起始地址也一定是 16 的倍数;偏移地址为 16 位,16 位地址的寻址能力为 64KB, 所以一个段的长度最大为 64KB。
内存单元地址小结
CPU 访问内存单元时,必须向内存提供内存单元的物理地址。8086CPU 在内部用段地址和偏移地址移位相加的方法形成最终的物理地址。
(1)、CPU 可以用不同的段地址和偏移地址形成同一个物理地址。比如 CPU 要访问 21F60H 单元,则它给出的段地址SA和偏移地址EA满足SAx16 + EA = 21F60H即可。
(2)、如果给定一个段地址,仅通过变化偏移地址来进行寻址,最多可定位多少个内存单元?
结论:偏移地址 16 位, 变化范围为 0 ~ FFFFH,仅使用偏移地址来寻址最多可寻 64KB 个内存单元。
在 8086PC 机中,存储单元的地址用两个元素来描述,即段地址和偏移地址。
“数据在21F60H内存单元中。”这句话对于 8086PC 机一般不这么讲,取而代之的是两种类似的说法:a、数据存在内存 2000:1F60 单元中,b、数据存在内存的2000H段中的1F60H单元中。
可以根据需要,将地址连续、起始地址为 16 的倍数的一组内存单元定义为一个段。
2.9 段寄存器
我们前面讲到,8086CPU 在访问内存时要由相关部件提供内存单元的段地址和偏移地址,送入地址加法器合成物理地址。这里,需要看一下,是什么部件提供段地址。段地址在 8086CPU 的段寄存器中存放。8086CPU 有 4 个段寄存器:CS、DS、SS、ES。当 8086CPU 要访问内存时由这 4 个段寄存器提供内存单元的段地址。
2.10 CS 和 IP
CS 和 IP 是 8086CPU 中两个最关键的寄存器,它们指示了 CPU 当前要读取指令的地址。CS 为代码段寄存器,IP 为指令指针寄存器,从名称上我们可以看出它们和指令的关系。
在 8086CPU 中,任意时刻,设 CS 中的内容为 M ,IP 中的内容为 N,8086CPU 将从内存 Mx16 + N 单元开始,读取一条指令并执行。
也可以这样表述:8086机中,任意时刻,CPU 将 CS:IP 指向的内容当做指令执行。
8086CPU 的工作过程可以简要描述如下:
(1)从 CS:IP 指向的内存单元读取指令,读取的指令进入指令缓冲器;
(3)IP = IP + 所读取指令的长度,从而指向下一条指令;
(4)执行指令。转到步骤(1),重复这个过程。
2.11 修改CS、IP的指令
在 CPU 中,程序员能够用指令读写的部件只有寄存器,程序员可以通过改变寄存器中的内容实现对 CPU 的控制。CPU 从何处执行指令是由 CS、IP 中的内容决定的,程序员可以通过改变 CS、IP 中 的内容来控制 CPU 执行目标指令。
8086CPU 大部分寄存器的值,都可以用 mov 指令来改变,mov 指令被称为传送指令。但是,mov 指令不能用于设置CS、IP的值,原因很简单,因为 8086CPU 没有提供这样的功能。8086CPU 为 CS、IP 提供了另外的指令来改变它的值。能够改变 CS、IP 的内容的指令被统称为转移指令。我们现介绍一个最简单的可以修改CS、IP的指令:jmp指令。
若想同时修改CS、IP的内容,可用形如:“jmp 段地址:偏移地址”的指令完成,如:
jmp 2AE3:3,执行后,CS=2AE3H,IP=0003H,CPU 将从 2AE33H 处读取指令。
jmp 3:0B16,执行后,CS=0003H,IP=0B16H,CPU 将从 00B46H 处读取指令。
“jmp 段地址:偏移地址”指令的功能为:用指令中给出的段地址修改 CS,偏移地址修改 IP。
若想仅修改 IP 的内容,可用形如“jmp 某一合法寄存器”的指令完成,如:
jmp ax,指令执行前:ax=1000H,CS=2000H,IP=0003H
指令执行后:ax=1000H,CS=2000H,IP=1000H
“jmp 某一合法寄存器”指令的功能为:用寄存器中的值修改IP。
jmp ax,含义上好似:mov IP, ax。
2.12 代码段
前面讲过,对于 8086PC 机,在编程时,可用根据需要,将一组内存单元定义为一个段,我们可以将长度为N(N≤64KB)的一组代码,存在一组地址连续、起始地址为 16 的倍数的内存单元中,我们可以认为,这段内存时用来存放代码的,从而定义了一个代码段。比如,将:
mov ax,0000 (B8 00 00) add ax,0123H (05 23 01) mov bx,ax (8B D8) jmp bx (FF E3)
这段长度为 10 个字节的指令,存放在 123B0H~123B9H 的一组内存单元中,我们就可以认为,123B0H~123B9H 这段内存是用来存放代码的,是一个代码段,它的段地址为 123BH,长度为 10 个字节。
如何使得代码段中的指令被执行呢?要让 CPU 执行我们放在代码段中的指令,必须要将 CS:IP 指向所定义的代码段中的第一条指令的首地址。如上面的例子,可设 CS=123BH、IP=0000H。
2.9~2.12 小 结
(1)、段地址在 8086CPU 的段寄存器中存放。当 8086CPU 要访问内存时,由段寄存器提供内存单元的段地址。8086CPU 有四个段寄存器,其中 CS 用来存放指令的段地址。
(2)、CS 存放指令的段地址,IP存放指令的偏移地址。
8086PC 机中,任意时刻,CPU 将 CS:IP 指向的内容当做指令执行。
(3)、8086CPU 的工作过程:
① 从 CS:IP 指向的内存单元读取指令,读取的指令进入指令缓冲器;
② IP 指向下一条指令;
③ 执行指令。(转到步骤①,重复这个过程。)
(4)、8086CPU 提供转移指令修改 CS、IP 的内容。