GNU ARM汇编快速入门

以前用ARM的IDE工具,使用的是ARM标准的汇编语言。现在要使用GNU的工具,当然要了解一点GNU ARM汇编的不同之处。其实非常的简单,浏览一下文档然后再看看程序就完全可以搞定了,或者你硬着头皮看GNU ARM的汇编程序,用不了多少时间你就就可以无师自通了。

ARM汇编语言源程序语句 ,一般由指令、伪操作、宏指令和伪指令作成。ARM汇编语言的设计基础是汇编伪指令,汇编伪操作和宏指令。

目前常用的ARM编译环境有2种:
ARMASM: ARM公司的IDE中使用了CodeWarrior的编译器,绝大多数windows下的开发者都在使用这一环境,完全按照ARM的规定;
GNU ARM ASM:GNU工具的ARM版本,与ARMASM略有不同;

关于CodeWarriror ARM汇编的书和文章很多,本文假定你已经完全了解ARMASM,这里只说明GNU ARM汇编,并针对ARMASM给出说明。本文翻译自:GNU ARM Assembler Quick Reference, 本人水平有限,错误难免,转载随意,请注明出处。英文原文地址不详。


GNU ARM 汇编快速入门

任何汇编行都是如下结构:
[<label>:] [<instruction or directive>} @ comment
[<标签>:] [<指令>} @ 注释
GNU ARM 汇编中,任何以冒号结尾的都被认为是一个标签,而不一定非要在一行的开始。下面是一个简单的例子,这段汇编程序定义了一个"add"的函数,该函数返回两个参数的和:
.section .text, “x”
.global add @ give the symbol add external linkage
add:
ADD r0, r0, r1 @ add input arguments
MOV pc, lr @ return from subroutine
@ end of program
GNU ARM汇编伪指令

下面列出了一些GNU ARM汇编伪指令,并给出了相应说明。

.ascii “<string>” 在汇编中定义字符串并为之分配存储空间(与armasm中的DCB功能类似)。
.asciz “<string>” 和.ascii类似, 但不分配存储空间。
.balign <power_of_2> {,<fill_value> {,<max_padding>} }
以某种排列方式在内存中填充数值。 (该指令与armasm中的ALIGN类似)。
power_of_2表示排列方式,其值可为4,8,16或32,单位是byte;
fill_value是要填充的值;
max_padding最大的填充界限,请求填充的bytes数超过该值,将被忽略。
.byte <byte1> {,<byte2>} … 定义一个或多个Byte,并为之分配空间(与armasm的DCB类似)。  
.code <number_of_bits> 设定指令宽度,16表示Thumb,32表示ARM assembly
(和armasm中的CODE16,CODE32相同)。
.if  
.else
.endif
预编译宏(与armasm中的IF ELSE ENDIF相同)。
.end 汇编文件结束标志,常常省略不用。

.endm 宏结束标志。
.exitm 宏跳出。
.macro <name> {<arg_1} {,<arg_2>} … {,<arg_N>}
定义一段名为name的宏,arg_xxx为参数。
必须有对应的.endm结尾。
可以使用.exitm从中间跳出宏。(与armasm中的MACRO, MEND, MEXIT相同)。
在使用宏参数时必须这样使用:“\<arg>”。
例如:
[CODE].macro SHIFTLEFT a, b
.if \b < 0
MOV \a, \a, ASR #-\b
.exitm
.endif
MOV \a, \a, LSL #\b
.endm

.rept <number_of_times> 循环执行.endr前的代码段number_of_times次。
(与armasm中的WEN相似)

.irp <param> {,<val_1>} {,<val_2>} …
循环执行.endr前的代码段,param依次取后面给出的值。
在循环执行的代码段中必须以“\<param> ”表示参数。

.endr 结束循环(与armasm中的WEND相似).
.equ <symbol name>, <value> 为一个标号赋值,类似C中的#define。(与armasm中的EQU相同)
.err 编译错误报告,将引起编译的终止。
.global <symbol> 全局声明标志,这样声明的标号将可以被外部使用。(与armasm中的EXPORT相同)。
.hword <short1> {,<short2>} …
插入一个16-bit的数据队列。(与armasm中的DCW相同)
.ifdef <symbol> 如果 <symbol>被定义,该快代码将被编译。以 .endif结束。
.ifndef <symbol> 如果 <symbol>未被定义,该快代码将被编译。以 .endif结束。
.include “<filename>” 包含文件。(与armasm中的INCLUDE 或者C中的#i nclude一样)
<register_name> .req <register_name>
定义一个寄存器,.req的左边是定义的寄存器名,右边是使用的真正使用的寄存器。
(与armasm中的RN类似)
例如:acc .req r0
[CODE].section <section_name> {,”<flags>”}
开始一个新的代码或数据段。.text, 代码段;.data, 初始化数据段;.bss, 未初始化数据段。
这些段都有缺省的标志(flags),联接器可以识别这些标志。(与armasm中的AREA相同)。
下面是ELF格式允许的段标志
<标志> 含义
a 允许段
w 可写段
x 执行段
.set <variable_name>, <variable_value> 变量赋值。(与armasm中的SETA相同)
.space <number_of_bytes> {,<fill_byte>}
分配number_of_bytes字节的数据空间,并填充其值为fill_byte,若未指定该值,缺省填充0。
(与armasm中的SPACE功能相同)
.word <word1> {,<word2>} …
插入一个32-bit的数据队列。(与armasm中的DCD功能相同)

GNU ARM汇编特殊字符和语法

代码行中的注释符号: ‘@’
整行注释符号: ‘#’
语句分离符号: ‘;’
直接操作数前缀: ‘#’ 或 ‘$’
.arm 以arm格式编译,同code32
.thumb 以thumb格式编译,同code16
.code16 以thumb格式编译
.code32 以arm格式编译
篇后语:

更详细的使用说明请参照:ARM Architecture Reference Manual, Addison-Wesley ISBN 0-201-73719-1
补充:

4 ARM GNU常用汇编语言介绍
4.1 ARM GNU常用汇编伪指令介绍
1. abort
.abort: 停止汇编
.align abs-expr1, abs-expr2: 以某种对齐方式,在未使用的存储区域填充值. 第一个值表示对齐方式,4, 8,16或32. 第
二个表达式值表示填充的值.
2. if...else...endif
.if
.else
.endif: 支持条件预编译
3. include
.include "file": 包含指定的头文件, 可以把一个汇编常量定义放在头文件中.
4. comm
.comm symbol, length:在bss段申请一段命名空间,该段空间的名称叫symbol, 长度为length.      Ld连接器在连接会
为它留出空间.
5. data
.data subsection: 说明接下来的定义归属于subsection数据段.
6.      equ
.equ symbol, expression: 把某一个符号(symbol)定义成某一个值(expression).该指令并不分配空间.
7. global
.global symbol: 定义一个全局符号, 通常是为ld使用.
8. ascii
.ascii "string": 定义一个字符串并为之分配空间.
9. byte
.byte expressions: 定义一个字节, 并为之分配空间.
10. short
.short expressions: 定义一个短整型,      并为之分配空间.
11. int
.int expressions: 定义一个整型,并为之分配空间.
12 long
.long expressions: 定义一个长整型, 并为之分配空间.
13 word
.word expressions: 定义一个字,并为之分配空间, 4bytes.
14. macro/endm
.macro: 定义一段宏代码, .macro表示代码的开始, .endm表示代码的结束.
15. req
name .req register name:      为寄存器定义一个别名.
16. code
.code [16|32]: 指定指令代码产生的长度, 16表示Thumb指令, 32表示ARM指令.
17. ltorg
.ltorg: 表示当前往下的定义在归于当前段,并为之分配空间.
4.2 ARM GNU专有符号
1. @
表示注释从当前位置到行尾的字符.
2. #
注释掉一整行.
3. ;
新行分隔符.
4.3 操作码
1. NOP
       nop
       空操作, 相当于MOV r0, r0
2. LDR
          ldr <register> , = <expression>
       相当于PC寄存器或其它寄存器的长转移.
3.ADR
          adr <register> <label>
       相于PC寄存器或其它寄存器的小范围转移.
       ADRL
          adrl <register> <label>
       相于PC寄存器或其寄存器的中范围转移.

原文地址:http://blog.csdn.net/lbsljn/archive/2009/06/17/4277640.aspx
posted @ 2011-06-11 20:14  hnrainll  阅读(8732)  评论(0编辑  收藏  举报