寄存器

一个典型的 CPU 由运算器、控制器、寄存器等器件组成，这些器件靠内部总线相连。内部总线实现 CPU 内部各个器件之间的联系，外部总线实现 CPU 和主板上其他器件的联系。简单地说，在 CPU 中：

运算器进行信息处理
寄存器进行信息存储
控制器控制各种器件进行工作
内部总线连接各种器件，在它们之间进行数据的传送。

对于一个汇编程序员来说，CPU 中的主要部件是寄存器。寄存器是 CPU 中程序员可以用指令读写的部件。程序员通过改变各种寄存器中的内容来实现对 CPU 的控制。

不同的 CPU，寄存器的个数、结构是不相同的。8086CPU 有14个寄存器，每个寄存器有一个名称。这些寄存器是：AX、BX、CX、DX、SI、DI、SP、BP、IP、CS、SS、DS、ES、PSW。

2.1 通用寄存器

8086CPU 的所有寄存器都是16位的，可以存放两个字节。AX、BX、CX、DX 这四个寄存器通常用来存放一般性数据，被称为通用寄存器。

一个 16 位寄存器所可以存储一个 16 位的数据。

8086CPU 的上一代 CPU 中的寄存器都是 8 位的，为了保证兼容，使原来基于上代 CPU 编写的程序稍加修改就可以运行在8086之上，8086CPU 的AX、BX、CX、DX这四个寄存器都可分为两个独立使用的 8 位寄存器来使用：

AX 可分为 AH 和 AL；
BX 可分为 BH 和 BL；
CX 可分为 CH 和 CL；
DX 可分为 DH 和 DL；

以AX为例，8086CPU 的 16 位寄存器中，AX的低 8 位(0 位 ~ 7 位)构成了 AL 寄存器，高 8 位(8 位 ~ 15 位)构成了 AH 寄存器。AH 和 AL 寄存器是可以独立使用的 8 位寄存器。

2.2 字在寄存器中的存储

出于对兼容性的考虑，8086CPU 可以一次性处理以下两种尺寸的数据。

字节：记为 byte，一个字节由 8 个 bit 组成，可以存放在 8 位寄存器中。
字：记为 word，一个字由两个字节组成，这两个字节分别称为这个字的高位字节和低位字节。

　　一个字可以存放在一个 16 位寄存器中，这个字的高位字节和低位字节自然就存在这个寄存器的高 8 位寄存器和低 8 位寄存器中。如上图所示，一个字型数据 20000，存在 AX 寄存器中，在 AH 中存储了它的高 8 位，在 AL 中存储了它的低 8 位。AH 和 AL 中的数据，既可以看成是一个字型数据的高 8 位和低 8 位，这个字型数据的大小是 20000；又可以看作是两个独立的字节型数据，它们的大小分别是 78 和 32。

2.3 几条汇编指令

在写一条汇编指令或一个寄存器的名称时不区分大小写。如 mov ax, 18 和 MOV AX, 18 的含义相同；bx 和 BX 的含义相同。

2.4 物理地址

我们知道，CPU 访问内存单元时，要给出内存单元的地址。所有的内存单元构成的存储空间是一个一维的线性空间，每一个内存单元在这个空间中都有唯一的地址，我们将这个唯一的地址称为物理地址。

2.5 16位结构的 CPU

　　16位结构（16 位机、字长为 16 位等说法，与 16 位结构的含义相同）具有以下几方面的结构特性：

运算器一次最多可以处理 16 位的数据
寄存器的最大宽度为 16 位
寄存器和运算器之间的通路为 16位

　　8086 是 16 位结构的 CPU，这也就是说，在 8086 内部，能够一次性处理、传输、暂时存储的信息的最大长度是 16 位的。内存单元的地址在送上地址总线之前，必须在 CPU 中处理、传输、暂时存放，对于 16 位 CPU，能一次性处理、传输、暂时存储 16 位的地址。

2.6 8086CPU 给出物理地址的方法

　　8086CPU 有 20 位地址总线，可以传送 20 位地址，达到 1MB 寻址能力。8086CPU 又是 16位结构，从 8086CPU 的内部结构来看，如果将地址从内部简单地发出，那么它只能送出 16 位的地址，表现出的寻址能力只有 64KB。

　　8086CPU 采用一种在内部用两个 16 位地址合成的方法来形成一个 20 位的物理地址。

　　如上图所示，当 8086CPU 要读写内存时：

（1）、CPU 中的相关部件提供两个 16 位的地址，一个称为段地址，另一个称为偏移地址；

（2）、段地址和偏移地址通过内部总线送入一个被称为地址加法器的部件；

（3）、地址加法器将两个 16 位地址合成为一个 20 位的物理地址；

（4）、地址加法器通过内部总线将 20 位物理地址送入输入输出控制电路；

（5）、输入输出控制电路将 20 位物理地址送上地址总线；

（6）、20 位物理地址被地址总线传送到存储器。

　　地址加法器采用 物理地址 = 段地址x16 + 偏移地址 的方法用段地址和偏移地址合成物理地址。段地址x16 有一个更为常用的说法是左移 4 位。计算机中的所有信息都是以二进制的形式存储的，段地址当然也不例外。机器只能处理二进制信息，左移4位中的位，指的是二进制位。(2^4，2的四次方)。地址加法器就是通过将以二进制形式存放的段地址左移 4 位来完成段地址x16的运算的。

2.7 段地址 x 16 + 偏移地址 = 物理地址的本质含义

　　“段地址x16 + 偏移地址 = 物理地址”的本质含义是：CPU 在访问内存时，用一个基础地址（段地址x16）和一个相对于基础地址的偏移地址相加，给出内存单元的物理地址。

　　更一般地说，8086CPU 这种寻址功能是“基础地址 + 偏移地址 = 物理地址”寻址模式的一种具体实现方案，8086CPU 中，段地址x16 可看做是基础地址。

2.8 段的概念

　　我们注意到，“段地址”这个名称中包含着“段”的概念。这种说法可能对一些学习者产生了误导，使人误以为内存被划分成了一个一个的段，每一个段有一个段地址。如果一开始就形成了这种认识，将影响以后对汇编语言的深入理解和灵活应用。

　　其实，内存并没有分段，段的划分来自于 CPU，由于 8086CPU 用“基础地址（段地址x16） + 偏移地址 = 物理地址”的方式给出内存单元的物理地址，使得我们可以用分段的方式来管理内存。

　　以后，在编程的时候可以根据需要，将若干地址连续的内存单元看作一个段，用段地址x16 定位段的起始地址（基础地址），用偏移地址定位段中的内存单元。有两点需要注意：段地址x16 必然是 16 的倍数，所以一个段的起始地址也一定是 16 的倍数；偏移地址为 16 位，16 位地址的寻址能力为 64KB，所以一个段的长度最大为 64KB。

内存单元地址小结

　　CPU 访问内存单元时，必须向内存提供内存单元的物理地址。8086CPU 在内部用段地址和偏移地址移位相加的方法形成最终的物理地址。

（1）、CPU 可以用不同的段地址和偏移地址形成同一个物理地址。比如 CPU 要访问 21F60H 单元，则它给出的段地址SA和偏移地址EA满足SAx16 + EA = 21F60H即可。

（2）、如果给定一个段地址，仅通过变化偏移地址来进行寻址，最多可定位多少个内存单元？

　　结论：偏移地址 16 位，变化范围为 0 ~ FFFFH，仅使用偏移地址来寻址最多可寻 64KB 个内存单元。

在 8086PC 机中，存储单元的地址用两个元素来描述，即段地址和偏移地址。

　　“数据在21F60H内存单元中。”这句话对于 8086PC 机一般不这么讲，取而代之的是两种类似的说法：a、数据存在内存 2000:1F60 单元中，b、数据存在内存的2000H段中的1F60H单元中。

　　可以根据需要，将地址连续、起始地址为 16 的倍数的一组内存单元定义为一个段。

2.9 段寄存器

　　我们前面讲到，8086CPU 在访问内存时要由相关部件提供内存单元的段地址和偏移地址，送入地址加法器合成物理地址。这里，需要看一下，是什么部件提供段地址。段地址在 8086CPU 的段寄存器中存放。8086CPU 有 4 个段寄存器：CS、DS、SS、ES。当 8086CPU 要访问内存时由这 4 个段寄存器提供内存单元的段地址。

2.10 CS 和 IP

　　CS 和 IP 是 8086CPU 中两个最关键的寄存器，它们指示了 CPU 当前要读取指令的地址。CS 为代码段寄存器，IP 为指令指针寄存器，从名称上我们可以看出它们和指令的关系。

　　在 8086CPU 中，任意时刻，设 CS 中的内容为 M ，IP 中的内容为 N，8086CPU 将从内存 Mx16 + N 单元开始，读取一条指令并执行。

　　也可以这样表述：8086机中，任意时刻，CPU 将 CS:IP 指向的内容当做指令执行。

　　8086CPU 的工作过程可以简要描述如下：

（1）从 CS:IP 指向的内存单元读取指令，读取的指令进入指令缓冲器；

（3）IP = IP + 所读取指令的长度，从而指向下一条指令；

（4）执行指令。转到步骤（1），重复这个过程。

2.11 修改CS、IP的指令

　　在 CPU 中，程序员能够用指令读写的部件只有寄存器，程序员可以通过改变寄存器中的内容实现对 CPU 的控制。CPU 从何处执行指令是由 CS、IP 中的内容决定的，程序员可以通过改变 CS、IP 中的内容来控制 CPU 执行目标指令。

　　8086CPU 大部分寄存器的值，都可以用 mov 指令来改变，mov 指令被称为传送指令。但是，mov 指令不能用于设置CS、IP的值，原因很简单，因为 8086CPU 没有提供这样的功能。8086CPU 为 CS、IP 提供了另外的指令来改变它的值。能够改变 CS、IP 的内容的指令被统称为转移指令。我们现介绍一个最简单的可以修改CS、IP的指令：jmp指令。

　　若想同时修改CS、IP的内容，可用形如：“jmp 段地址：偏移地址”的指令完成，如：

　　jmp 2AE3:3，执行后，CS=2AE3H，IP=0003H，CPU 将从 2AE33H 处读取指令。

　　jmp 3:0B16，执行后，CS=0003H，IP=0B16H，CPU 将从 00B46H 处读取指令。

　　“jmp 段地址：偏移地址”指令的功能为：用指令中给出的段地址修改 CS，偏移地址修改 IP。

　　若想仅修改 IP 的内容，可用形如“jmp 某一合法寄存器”的指令完成，如：

　　jmp ax，指令执行前：ax=1000H，CS=2000H，IP=0003H

　　　　　　指令执行后：ax=1000H，CS=2000H，IP=1000H

　　“jmp 某一合法寄存器”指令的功能为：用寄存器中的值修改IP。

　　jmp ax，含义上好似：mov IP, ax。

2.12 代码段

　　前面讲过，对于 8086PC 机，在编程时，可用根据需要，将一组内存单元定义为一个段，我们可以将长度为N（N≤64KB）的一组代码，存在一组地址连续、起始地址为 16 的倍数的内存单元中，我们可以认为，这段内存时用来存放代码的，从而定义了一个代码段。比如，将：

mov ax,0000   (B8 00 00)
add  ax,0123H (05 23 01)
mov bx,ax       (8B D8)
jmp bx            (FF E3)

　　这段长度为 10 个字节的指令，存放在 123B0H~123B9H 的一组内存单元中，我们就可以认为，123B0H~123B9H 这段内存是用来存放代码的，是一个代码段，它的段地址为 123BH，长度为 10 个字节。

　　如何使得代码段中的指令被执行呢？要让 CPU 执行我们放在代码段中的指令，必须要将 CS:IP 指向所定义的代码段中的第一条指令的首地址。如上面的例子，可设 CS=123BH、IP=0000H。

2.9~2.12 小结

（1）、段地址在 8086CPU 的段寄存器中存放。当 8086CPU 要访问内存时，由段寄存器提供内存单元的段地址。8086CPU 有四个段寄存器，其中 CS 用来存放指令的段地址。

（2）、CS 存放指令的段地址，IP存放指令的偏移地址。

　　8086PC 机中，任意时刻，CPU 将 CS:IP 指向的内容当做指令执行。

（3）、8086CPU 的工作过程：

① 从 CS:IP 指向的内存单元读取指令，读取的指令进入指令缓冲器；

② IP 指向下一条指令；

③ 执行指令。（转到步骤①，重复这个过程。）

（4）、8086CPU 提供转移指令修改 CS、IP 的内容。

posted @ 2017-10-01 23:22 佚名000 阅读(395) 评论(0) 收藏举报

刷新页面返回顶部

纸上得来终觉浅，绝知此事要躬行。

寄存器

2.1 通用寄存器

2.2 字在寄存器中的存储

2.3 几条汇编指令

2.4 物理地址

2.5 16位结构的 CPU

2.6 8086CPU 给出物理地址的方法

2.7 段地址 x 16 + 偏移地址 = 物理地址的本质含义

2.8 段的概念

内存单元地址小结

2.9 段寄存器

2.10 CS 和 IP

2.11 修改CS、IP的指令

2.12 代码段

2.9~2.12 小结

公告

纸上得来终觉浅，绝知此事要躬行。

寄存器

2.1 通用寄存器

2.2 字在寄存器中的存储

2.3 几条汇编指令

2.4 物理地址

2.5 16位结构的 CPU

2.6 8086CPU 给出物理地址的方法

2.7 段地址 x 16 + 偏移地址 = 物理地址 的本质含义

2.8 段的概念

内存单元地址小结

2.9 段寄存器

2.10 CS 和 IP

2.11 修改CS、IP的指令

2.12 代码段

2.9~2.12 小 结

公告

2.7 段地址 x 16 + 偏移地址 = 物理地址的本质含义

2.9~2.12 小结