微机原理与系统设计笔记3 | 8086cpu指令系统

打算整理汇编语言与接口微机这方面的学习记录。本部分介绍8086的指令系统（一些与程序设计密切相关的如子程序调用指令放在下一部分）。
参考资料
- 西电《微机原理与系统设计》周佳社
- 西交《微机原理与接口技术》
- 课本《汇编语言与接口技术》王让定
- 小甲鱼《汇编语言》

1. 汇编语言指令

1.1 8086汇编语言程序中语句种类

指令语句

汇编后翻译为二进制代码，CPU可以执行的语句。
伪指令语句

CPU并不直接执行的语句，如上一篇笔记中提到的DD和DB。
宏指令语句

8086指令系统中没有的指令，是由用户使用宏指令定义伪指令来自定义的新指令。

1.2 汇编语言中语句的组成

（变量名、标号名：）助记符操作数 ;注释

变量名、标号名不一定有，两者都代表一个地址。
;后的是注释，不参加汇编过程，相当于C语言中的"//"
这部分不重要，老师只是在讲汇编的大体印象。

1.3 汇编语言中的常数及表达式

突然感觉还是这门课虽然评价很高，但还是一种知识清单式的讲解...

常数
- 十进制常数、十六进制常数、字符常数、字符串常数、？（随机数）
表达式
- 操作符—算术操作符、逻辑操作符、关系操作符、属性操作符、其他操作符
- 这里有个汇编过程进行的计算和CPU执行的计算，挺好分辨的，前者就好是简单的计算式，后者需要CPU结构。

1.4 标号、变量与伪指令

标号在指令语句左侧，代表指令的地址，常用于指令跳转。

标号一旦定义，三个属性：
- ```
NEXT:
	......
	JZ NEXT
```
  这里的NEXT就是标号。
- 标号有三个属性（或者说信息）：
  1. 段地址属性SEG
  2. 偏移地址属性OFFSET
    前两者加起来其实就是标号代表此处的地址（16位），但是实际上经常会分别单独获取两个属性，比如获取偏移属性
```
MOV BX,OFFSET NEXT
```
  3. 类型TYPE
    
    有两种，NEAR近程（段内转移，值为-1）和FAR远程（段间转移，值为-2）
    
    虽说TYPE有值，但是是在汇编过程中根据程序跳转的种类赋予的，自己写代码获取type值就并没有意义。
变量定义伪指令

DB 定义字节型变量，DW 定义字型变量，DD 双字型变量
- 变量定义后，具有5个属性
  1. 段地址 SEG
  2. 段内偏移地址（经常使用，OFFSET）
  3. 类型（DB=1，DW=2，DD=4，字节数）TYPE
  4. 长度 LENGTH
  5. 大小 SIZE
- 在MASM汇编器中有一个$ 16位的位置计数器，在汇编过程中指向存储的位置。应用举例：
```
DATA1 DB 0CH,12H
DATA2 DW $+2
```
  这里存储空间由低到高分别是0CH,12H和两字节的$+2，其值为0004H（高字节地址空间为00H，低字节为04H）
- 一个注意事项——用变量定义来定义字符串时：
  - DB定义的字符串可以在存储器允许范围无限扩充
  - DD和DW定义字符串，单引号之间最多两个字符。
  - 字符数据定义举例：
```
DATA1 DB 'this'
;在存储器中为 't' 'h' 'i' 's'
DATA2 DW 'AB'
;在存储器中为 'B' 'A
;这是因为前者是字节型，没有高低8位之分
```
- 用变量定义变量：
```
DATAX DW DATA1
;也就是这个字单元存放DATA1的偏移地址
```
- DUP操作符：重复操作符，允许嵌套
```
;常规
DATA5 DB 4 DUP(?)
;嵌套：课本P87-1.4
BUF1 DB 7 DUP(5 DUP(55H), 10 DUP(F0H))
```
  表示4个字节单元（重复4次），其中的值是随机的。
- 长度：在变量定义语句中，定义的变量的个数。如果出现DUP这种，最外层DUP左侧的数字就是个数，比如上面的嵌套就是7。
- 大小属性:所有变量所占的总的字节数。SIZE=TYPE*LENGTH

属性操作符和 PTR 操作符

属性操作符就是上面提到了的 SIZE TYPE LENGTH SEG OFFSET这些，不多介绍了。

PTR用于类型转化，是属性临时修改操作符（仅在PTR作用的语句中发生类型转换）。例子：

;例子1
MOV AX,DATA1;这不对，因为AX16位，DATA1是8位,所以应当转换为字变量：
MOV AX, WORD PTR DATA1
;例子2
MOV [BX],10H;这不对，因为不确定DS:BX对应的存储内容是什么形式的变量，有可能不匹配，汇编器不知道如何处理10H。
MOV BYTE PTR [BX],10H

2. 8086指令分类

《微机原理与接口技术》P31，这部分属于查表。

数据传送类指令
算术运算类指令
逻辑运算类指令
移位类指令
标志位操作指令
转移指令
- 有条件转移
- 无条件转移
循环控制指令
子程序调用和返回指令
中断调用返回指令
字符串操作指令
输入输出指令
其他指令
宏指令

3. 数据与转移地址的寻址方式

这部分很熟悉了，这是指令集在设计之初决定的寻找操作数的方法。

3.1 数据寻址方式

立即数寻址
- ```
MOV AX,1234H
MOV WORD PTR [0200H],56H
;类型要明确:一方明确，双方都明确
```
  立即数只能做源操作数，且只能传送给存储器和通用寄存器，不能直接给段寄存器。
寄存器寻址
- ```
MOV AX,DX
```
  源寄存器和目的寄存器的类型要一样。
注意事项
1. 立即数不能直接放到段寄存器DS,SS等。
2. CS IP不能当目的操作数。
3. 堆栈必须按字操作
存储器寻址

要寻找的操作数在存储器中。

存储单元的段内偏移地址，又有五种方式给出
1. 直接：
  
  如MOV AL,[2000H]，注意这里不需要PTR。实际使用过程中经常使用MOV AL,DATA1也就是变量来直接寻址。
  - 存储单元之间不能互相直接操作数据。如果将data2处数据放到data1，需要AL这种通用寄存器来过渡。
  - 此外，寄存器->data1，需要考虑类型匹配：
```
MOV DATA1,AX;错误
MOV WORD PTR DATA1，AX;正确
```
2. 寄存器间接寻址：
  
  只能用BX,SI,DI，如[BX]，具体语句：
```
MOV BX, OFFSET DATA1
MOV AL,[BX]
```
  同理，寄存器间接寻址也存在一个类型问题：
```
MOV [BX],12H;×
MOV BYTE PTR [BX],12H
```
3. 寄存器相对寻址：
  
  BX BP SI DI + 8/16位偏移
  
  (有效地址的一部分在寄存器中），如[BX]+1这里的1是指偏移一个字节（一个存储单元）。等效为：[BX]+3和3[BX]
  
  这里BP默认是在SS段。用于不破坏栈顶指针的相对寻址栈中元素（也就是不出栈）。
  
  这里老师又融会贯通了：
```
MOV DATA1[BX],AL
;等效为 OFFSET DATA1+(BX),此时段寄存器取决于DATA1定义在的段，如果data1在DS段，则应为
;DS:OFFSET DATA1+(BX)<--AL
;也即，如果偏移disp是一个变量，那么就取它的OFFSET
```
4. 基址变址寻址：
  
  基址寄存器：BX BP；变址寄存器： SI DI。
  
  如：[BX][SI]
  
  同理，BX默认DS，BP默认SS。
5. 基址变址且相对寻址：
  
  3、4两种的组合。
隐含寻址
- 隐藏目的操作数或源操作数的寻址方式，指令集默认指定。

3.2 转移地址寻址方式

段内转移

只有IP发生变化。有两种寻址方式：
- 段内直接寻址
  
  直接给出转移到的地址，这里还有一些细致的情况划分（但也合乎情理），老师讲解了三字节指令跳转和两字节指令跳转（这跟寻址范围有关）。
  这里提了一下短寻址，段内短寻址，意思是jmp到的目标地址并不在jmp前，而在jmp后，但程序设计者能够保证目标地址在当前ip后的127字节之内，此时可以用jmp short DST来寻址该指令后面的目标地址。而此时由于设计者保证其距离不超过127字节，所以此时这个指令语句仍为2字节，否则为3字节：
  - -128~0之内：2字节段内寻址
  - $-2^{15}$ ~ -128, +127 ~ $2^{15}-1$：3字节段内寻址
  - 0~127且有short短跳转标记：2字节段内寻址。
  CPU如何计算转移的目标地址：转移位置的IP = 当前IP + DISP
  
  DISP就在操作码后，区别是DISP放在一个字节里还是两个字节里。
  1. 8086指令系统中，所有的条件转移指令，只能在段内转移，且转移范围为当前IP为基准，范围为+128~-127；可以使用无条件转移指令搭桥，实现二级转移，达到更大范围的转移。
  2. 所有的条件转移指令，都是直接寻址。
- 段内间接寻址
  
  使用寄存器或者存储单元来存放段内地址。
```
MOV BX OFFSET L2;
JMP BX;
...
L2:...

;;;;或者
TABLE DW L2
JMP TABLE
;或者L2先放到BX里再放到TABLE里再jmp
;此例一开就跟前面接起来了，方式就多了去了
MOV BX,OFFSET TABLE
JMP WORD PTR [BX]
```
段间转移

8086不涉及，不过我记得386就涉及了，但我们老师也说非重点，先不操心这个了。

4. 传送类指令

除了标志传送指令SHAF和堆栈操作指令POPF外，其余传送指令不影响状态标志。
语法规则：
1. 立即数只能做源操作数
2. 类型要一致
3. 类型要明确
4. DS SS ES 做目的操作数时，立即数不能做源操作数
5. CS、IP不能做目的操作数
6. 两存储器单元之间不能互相操作，指令语句中两变量也不能直接运算

4.1 通用传送指令

MOV DST,SRC

4.2 取有效地址指令

LEA REG16，MEM
;将源操作数的有效地址放到16位寄存器中，为了方便使用，REG16最好使用BX BP SI DI
MOV BX,OFFSET DATA1
;等价于下面
LEA BX,DATA1

;但要与下面这个语句区分开
MOV BX,DATA1;这个意思是将DATA1处内容放到BX
;此时data1处类型不明确，所以
MOV BX,WORD PTR DATA1

4.3 取地址指针指令

不是很常用。

LDS REG16,MEM
;将双字变量MEM内容高16位放入DS，低16位放入REG
LES REG16,MEM
;将双字变量MEM内容高16位放入ES，低16位放入REG

注意，这里的REG不能是段寄存器，放几个合法的实例：

TABLE DB 10H,20H
POINT1 DD 02001000H
POINT2 DD TABLE

LDS DI,POINT1
;DS<-0200H,DI<-1000H
LES SI,POINT2
;ES<-TABLE段地址,SI<-TABLE偏移地址
LDS BX,[SI]
LES DI,[BX-5]

4.4 标志传送

LAHF;(AH)<--PSW寄存器的低8位
SAHF;PSW寄存器的低8位-->(AH)

隐含寻址了，因为默认指定。

4.5 数据交换指令

XCHG DST,SRC

可以完成两个操作数之间的数据交换：

不能使用段寄存器
不能完成存储器单元之间交换

4.6 字节转换

XLAT;(AL)<- (DS: (BX)+(AL) )
;将有效地址为 (BX)+(AL)存储单元的内容放入AL，如果输入AL，输出AL就是转换后的结果，这就是按字节转换：
MOV AL,4
LEA BX,TABLE
XLAT
;完成的工作就是将AL的内容4改为TABLE中的偏移量为4处的内容，相当于查表了。

4.7 堆栈操作

PUSH SRC;
POP DST;
PUSHF;
POPF;
;必须按字操作

5. 算术运算类指令

CPU执行运算类指令，就会影响状态寄存器
段寄存器不能参加运算。

5.1 加法指令

有三种。

ADD DST,SRC; DST<--DST+SRC
ADC DST,SRC; DST<--DST+SRC+CF
;ADD和ADC均影响6个标志位
INC DST;DST增1，放到DST
;根据结果设置除了CF以外的5个状态标志,一定注意

注意，INC的操作对象可以是存储器，简直不要太简洁

一个例子，不想打字了，是老师讲过的双字变量如何相加（当时在学校没有好好听）。

5.2 减法指令-跳转指令

有5条。

SUB DST,SRC; DST<--(DST)-(SRC)
SBB DST,SRC; DST<--(DST)-(SRC)-CF
;SUB和SBB均影响6个标志位
DEC DST; DST-1放回DST
;根据结果设置除了CF以外的5个状态标志
CMP DST,SRC ;DST-SRC，结果不放回，直接设置状态寄存器，常用于比较-条件-跳转

这个CMP单说没什么意思，它总是配合跳转指令形成if-else的汇编语块：

表里指令太多，基本上常用的也就JZ 。后面的JA/JNBE是无符号数的高低比较。JG/JNLE是有符号数的高低比较。

最后一条减法指令是求负指令

NEG DST;取负并设置6个状态寄存器

5.3 乘法指令

;无符号数乘法：
MUL SRC
;有符号数乘法：
IMUL SRC
;SRC不能是立即数

如果SRC字节型，DST在AL中，两者运算结果放在AX中（AH:AL）
如果SRC字型，DST在AX中,两者运算结果放在DX:AX中
无符号数乘法只影响CF OF，如果CF OF同为0，则高位为0（AH或DX）；相反同为1，高位有有效积。
有符号乘法如果CF OF同为0，则高位积无效（AH或DX），也即高位是低位的符号扩展：如果AL符号为负，则AH为8个1。同为1，高位有有效积。

5.4 除法指令

; 无符号除法
DIV SRC
; 有符号除法
IDIV SRC

SRC不能是立即数
无符号字节除法：DST是AX，运算结果的高低位分别放到AL和AH中。
无符号字除法：DST高低位分别放在DX AX，运算结果的高低位分别放在DX AX。
有符号数除法：余数正负与被除数相同。商正常运算，结果放到的位置与上述相同。

5.5 符号扩展指令

在一些运算中，为了使类型一致而设计的指令，比如a*b+c，a乘以b之后就32位，c需要扩展。

CBW ;AL扩展到AX中，AH是AL符号位的扩展
CWD ;AX扩展到DX中，DX是AX符号位的扩展

5.6 BCD数调整指令

这部分我是不太熟悉的，老师不是很常提这个，BCD以及组合BCD、分离BCD，见笔记1的3.6节。

加法BCD数调整
```
;加法组合BCD码调整
DAA
;加法分离BCD码调整
AAA
```
都是对 AL 进行调整。

举例：56+73=129
```
; 组合
MOV AL,56H ;01010110
ADD AL,73H ;01110011
;现在结果：C9H 1100 1001
DAA ;组合加法BCD码调整
; 1 0010 1001;也就是129
```
分离BCD的例子：

分离BCD 的调整比组合BCD 麻烦。

此外，解释一下AAA(ASCII Adjust for Addition)，为什么会有ASCII呢？原因就是上面图中的第二步：ASCII的'4'和'8'相较于04H和08H的区别在于高四位的末两位为1，相加之后高4位为0110，而第二步仍然清0，然后第三步就与上图一致。

减法BCD数调整

;减法 组合BCD调整：
DAS ;有借位则-6
;减法 分离BCD调整：
AAS

例子：

乘法分离BCD码调整
```
AAM ;对MUL的运算结果进行调整
;只影响ZF SF
```
例子在课本3.18，不贴了，理解就行。

除法分离BCD码调整

AAD ;除法分离BCD码，先调整后运算DIV
; AH*10 + AL --> AX

6. 逻辑运算指令

CPU执行运算类指令，就会影响状态寄存器
段寄存器不能参加运算。

逻辑与指令
```
AND DST,SRC
```
CF=0,OF=0,其余状态位正常设置
逻辑或指令
```
OR DST,SRC
```
CF=0,OF=0,其余状态位正常设置
异或运算
```
XOR DST,SRC;
```
CF=0,OF=0,其余状态位正常设置
逻辑测试指令
```
TEST DST,SRC
```
两者与但结果不放回两个寄存器，仅设置状态寄存器。
非运算指令
```
NOT DST
```
不影响六个状态标志

7. 移位类指令

无符号数移动就是逻辑移位，有符号数是算术移位。正常设置除AF外的5个标志。

逻辑移位
- 逻辑右移
```
SHR DST,CNT
;cnt=1时可以写出来，如果>1则放到CL中
```
- 逻辑左移
```
SHL DST,CNT
;cnt=1时可以写出来，如果>1则放到CL中
```
  SHL（左移）指令使目的操作数逻辑左移一位，最低位用 0 填充。最高位移入进位标志位，而进位标志位中原来的数值被丢弃
算术移位
- 算术右移
  
  最高位不变，最高位移动到次高位其余位向右移动，最低位移到CF
```
SAR DST,CNT
```
- 算术左移
  
  最高位变了，全部位左移，最高位交给CF。
```
SAL DST,CNT
```
循环移位

只影响OF，其他位不定义
- 不带CF的
  - 左移：
```
ROL DST,CNT
```
  - 右移：
```
ROR DST,CNT
```
- 带CF的循环
  - 左移
```
RCL DST,CNT
```
  - 右移
```
RCL DST,CNT
```

这个老师每个指令都要举例，刚想说循环移位有啥用，例子就给了我震撼。

41讲的指令系统实在太多了，吐了。

7. 标志位操作指令

重要的是CLI和STI，这个经常用，老师这里跳过了，微机里也不会使用这个的。

8. 转移指令

段内转移指令在5.2部分讲了，这里就只看段间的转移指令。

;===直接寻址:===
JMP FAR PTR ABC
...
ABC:...
;汇编成操作码(1字节)+OFFSET ABC(2字节)+SEG ABC(2字节)

;===间接寻址:===
;定义DS段
TABLE DD ABC;OFFSET ABC:SEG ABC---->地址指针
;定义代码段1
//JMP TABLE
LEA BX,TABLE
JMP DWORD PTR [BX];需要双字,包含OFFSET和SEG
;定义代码段2
ABC:...

10. 循环控制指令

LOOP 标号
- CX-1再放回CX，不影响标志寄存器
- 如果CX≠0，继续跳到标号处执行，否则向下运行
p43看完转p65，看到p67之后再转p44。
LOOPZ(LOOPE) 标号
- CX-1再放回CX，不影响标志寄存器
- 若CX!=0并且ZF==1，转移到标号处
  
  适合在指定区域中查找不同的字符，如果找到不同的，会退出循环。
LOOPNZ(LOOPNE) 标号

与上一个相反，CX!=0并且ZF=0时跳转到标号，适合找指定的字符，找到则退出循环。
JCXZ 标号

若 CX == 0，转移，测试cx开始时是否为0.

posted @ 2023-02-07 16:28 climerecho 阅读(3355) 评论(6) 收藏举报

刷新页面返回顶部

Clivia Du

A student of CS who enjoys electronic design