ARM汇编伪指令介绍
在ARM汇编语言程序里,有一些特殊的助记符,这些助记符与指令系统的助记符不同,没有相对应的操作码,这些特殊指令助记符被称为伪指令,他们所完成的操作称为伪操作。伪指令在源程序中的作用是为完成汇编程序作各种准备工作的,这些伪指令仅在汇编过程中起作用,一旦汇编结束,伪指令的使命就完成。
在ARM的汇编程序中,有如下几种伪指令:符号定义伪指令、数据定义伪指令、汇编控制伪指令、宏指令以及其他伪指令。
1)其他常用的伪指令
还有一些其他的伪指令,在汇编程序中经常会被使用,包括以下几条:
— AREA
— ALIGN
— CODE16、CODE32
— ENTRY
— END
— EQU
— EXPORT(或GLOBAL)
— IMPORT
— EXTERN
— GET(或INCLUDE)
— INCBIN
— RN
— ROUT
1.AREA
语法格式:
AREA段名属性1,属性2,……
AREA伪指令用于定义一个代码段或数据段。其中,段名若以数字开头,则该段名需用“ | ”括起来,如|1_test|。
属性字段表示该代码段(或数据段)的相关属性,多个属性用逗号分隔。常用的属性如下:
— CODE属性:用于定义代码段,默认为READONLY。
— DATA属性:用于定义数据段,默认为READWRITE。
— READONLY属性:指定本段为只读,代码段默认为READONLY。
— READWRITE属性:指定本段为可读可写,数据段的默认属性READWRITE。
— ALIGN属性:使用方式为ALIGN表达式。在默认时,ELF(可执行连接文件)的代码段和数据段是按字对齐的,表达式的取值范围为0~31,相应的对齐方式为2表达式次方。
— COMMON属性:该属性定义一个通用的段,不包含任何的用户代码和数据。各源文件中同名的COMMON段共享同一段存储单元。
一个汇编语言程序至少要包含一个段,当程序太长时,也可以将程序分为多个代码段和数据段。
使用示例:
AREA Init,CODE,READONLY
该伪指令定义了一个代码段,段名为Init,属性为只读
2.ALIGN
语法格式:
ALIGN {表达式{,偏移量}}
ALIGN伪指令可通过添加填充字节的方式,使当前位置满足一定的对其方式|。其中,表达式的值用于指定对齐方式,可能的取值为2的幂,如1、2、4、8、16等。若未指定表达式,则将当前位置对齐到下一个字的位置。偏移量也为一个数字表达式,若使用该字段,则当前位置的对齐方式为:2的表达式次幂+偏移量。
使用示例:
AREA Init,CODE,READONLY,ALIEN=3;指定后面的指令为8字节对齐。
指令序列
END
3.CODE16、CODE32
语法格式:
CODE16(或CODE32)
CODE16伪指令通知编译器,其后的指令序列为16位的Thumb指令。
CODE32伪指令通知编译器,其后的指令序列为32位的ARM指令。
若在汇编源程序中同时包含ARM指令和Thumb指令时,可用CODE16伪指令通知编译器其后的指令序列为16位的Thumb指令,CODE32伪指令通知编译器其后的指令序列为32位的ARM指令。因此,在使用ARM指令和Thumb指令混合编程的代码里,可用这两条伪指令进行切换,但注意他们只通知编译器其后指令的类型,并不能对处理器进行状态的切换。
使用示例:
AREA Init,CODE,READONLY
……
CODE32;通知编译器其后的指令为32位的ARM指令
LDR R0,=NEXT+1;将跳转地址放入寄存器R0
BX R0;程序跳转到新的位置执行,并将处理器切换到Thumb工作状态
……
CODE16;通知编译器其后的指令为16位的Thumb指令
NEXT LDR R3,=0x3FF
……
END;程序结束
4.ENTRY
语法格式:
ENTRY
ENTRY伪指令用于指定汇编程序的入口点。在一个完整的汇编程序中至少要有一个ENTRY(也可以有多个,当有多个ENTRY时,程序的真正入口点由链接器指定),但在一个源文件里最多只能有一个ENTRY(可以没有)。
使用示例:
AREA Init,CODE,READONLY
ENTRY;指定应用程序的入口点
……
5.END
语法格式:
END
END伪指令用于通知编译器已经到了源程序的结尾。
使用示例:
AREA Init,CODE,READONLY
……
END;指定应用程序的结尾
6.EQU
语法格式:
名称EQU表达式{,类型}
EQU伪指令用于为程序中的常量、标号等定义一个等效的字符名称,类似于C语言中的#define。
其中EQU可用“ * ”代替。
名称为EQU伪指令定义的字符名称,当表达式为32位的常量时,可以指定表达式的数据类型,可以有以下三种类型:
CODE16、CODE32和DATA
使用示例:
Test EQU 50;定义标号Test的值为50
Addr EQU 0x55,CODE32;定义Addr的值为0x55,且该处为32位的ARM令。
7.EXPORT(或GLOBAL)
语法格式:
EXPORT标号{[WEAK]}
EXPORT伪指令用于在程序中声明一个全局的标号,该标号可在其他的文件中引用。EXPORT可用GLOBAL代替。标号在程序中区分大小写,[WEAK]选项声明其他的同名标号优先于该标号被引用。
使用示例:
AREA Init,CODE,READONLY
EXPORT Stest;声明一个可全局引用的标号Stest……
END
8.IMPORT
语法格式:
IMPORT标号{[WEAK]}
IMPORT伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,而且无论当前源文件是否引用该标号,该标号均会被加入到当前源文件的符号表中。
标号在程序中区分大小写,[WEAK]选项表示当所有的源文件都没有定义这样一个标号时,编译器也不给出错误信息,在多数情况下将该标号置为0,若该标号为B或BL指令引用,则将B或BL指令置为NOP操作。
使用示例:
AREA Init,CODE,READONLY
IMPORT Main;通知编译器当前文件要引用标号Main,但Main在其他源文件中定义……
END
9.EXTERN
语法格式:
EXTERN标号{[WEAK]}
EXTERN伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,如果当前源文件实际并未引用该标号,该标号就不会被加入到当前源文件的符号表中。标号在程序中区分大小写,[WEAK]选项表示当所有的源文件都没有定义这样一个标号时,编译器也不给出错误信息,在多数情况下将该标号置为0,若该标号为B或BL指令引用,则将B或BL指令置为NOP操作。
使用示例:
AREA Init,CODE,READONLY
EXTERN Main;通知编译器当前文件要引用标号Main,但Main在其他源文件中定义……
END
10.GET(或INCLUDE)
语法格式:
GET文件名
GET伪指令用于将一个源文件包含到当前的源文件中,并将被包含的源文件在当前位置进行汇编处理。可以使用INCLUDE代替GET。
汇编程序中常用的方法是在某源文件中定义一些宏指令,用EQU定义常量的符号名称,用MAP和FIELD定义结构化的数据类型,然后用GET伪指令将这个源文件包含到其他的源文件中。使用方法与C语言中的“ include ”相似。
GET伪指令只能用于包含源文件,包含目标文件需要使用INCBIN伪指令
使用示例:
AREA Init,CODE,READONLY
GET a1.s;通知编译器当前源文件包含源文件a1.s
GE T C:\a2.s;通知编译器当前源文件包含源文件C:\ a2.s ……
END
11.INCBIN
语法格式:
INCBIN文件名
INCBIN伪指令用于将一个目标文件或数据文件包含到当前的源文件中,被包含的文件不作任何变动的存放在当前文件中,编译器从其后开始继续处理。
使用示例:
AREA Init,CODE,READONLY
INCBIN a1.dat;通知编译器当前源文件包含文件a1.dat
INCBIN C:\a2.txt;通知编译器当前源文件包含文件C:\a2.txt……
END
12.RN
语法格式:
名称RN表达式
RN伪指令用于给一个寄存器定义一个别名。采用这种方式可以方便程序员记忆该寄存器的功能。其中,名称为给寄存器定义的别名,表达式为寄存器的编码。
使用示例:
Temp RN R0;将R0定义一个别名Temp
13.ROUT
语法格式:
{名称} ROUT
ROUT伪指令用于给一个局部变量定义作用范围。在程序中未使用该伪指令时,局部变量的作用范围为所在的AREA,而使用ROUT后,局部变量的作为范围为当前ROUT和下一个ROUT之间。
2)ARM杂项伪指令
1.ADR伪指令:小范围的地址读取伪指令。
ADR指令将基于PC相对偏移的地址值读取到寄存器中。在汇编编译源程序时,ADR伪指令被编译器替换成一条合适的指令。通常编译器用一条ADD指令或SUB指令来实现该ADR伪指令的功能。
指令格式:ADR{cond} register ,expr
Register加载的寄存器
Expr程序相对偏移或寄存器相对偏移的表达式
非字对齐地址在-255~255字节范围内;
字对齐地址在-1020~1020字节范围内。
举例:
Start MOV R1,#10
ADR R4,start ;相当于PC-10后赋值给R4
2.ADRL指令:中等范围的地址读取伪指令。
ADRL指令将基于PC相对偏移的地址值或基于相对偏移的地址值读取到寄存器中,比ADR伪指令可读取更大范围的地址。在汇编编译源程序时,ADRL伪指令被编译器替换成两条合适的指令。若不能用两条指令实现ADRL伪指令功能,则产生错误,编译失败。
指令格式与ADR相同
非字对齐地址在64K字节范围内;
字对齐地址在256K字节范围内。
举例:
Start MOV R1,#10
ADR R4,start+6000 ;=>ADD R4,PC,#0xe800 ADD R4,R4,#0x254
3.LDR指令 大范围的地址读取伪指令
LDR伪指令用于加载32位的立即数或一个地址值到指定寄存器。
在汇编编译源程序时,LDR指令被编译器替换成一条合适的指令,若加载的常数未超出MOV或MVN的范围,则使用MOV或MVN指令代替该LDR伪指令,否则汇编器将常量放入字池(内存),并使用一条程序相对偏移的LDR指令从文字池读出常量。
指令格式:LDR {cond} register , = expr/label_expr
Expr32位立即数
Label_expr基于PC的地址表达式或外部表达式
举例
LDR R0,=0x123987;加载32位立即数
LDR R0,=DATA_BUF+60;加载DATA_BUF地址+60
4.NOP指令
NOP指令产生所需的ARM无操作代码。可以使用指令MOV R0,R0。NOP不能有条件使用。执行和不执行无操作指令是一样的,因而不需要有条件执行。ALU状态不受NOP影响。
3)符号定义( Symbol Definit年ion)伪指令
符号定义伪指令用于定义ARM汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。
常见的符号定义伪指令有如下几种:
Ø用于定义全局变量的GBLA、GBLL和GBLS
Ø用于定义局部变量的LCLA、LCLL和LCLS
Ø用于对变量赋值的SETA、SETL、SETS
Ø为通用寄存器列表定义名称的RLIST
1.GBLA、GBLL和GBLS
语法格式:
GBLA(GBLL或GBLS)全局变量名
GBLA、GBLL和GBLS伪指令用于定义一个ARM程序中的全局变量,并将其初始化。其中:
GBLA伪指令用于定义一个全局的数字变量,并初始化为0;
GBLL伪指令用于定义一个全局的逻辑变量,并初始化为F(假);
GBLS伪指令用于定义一个全局的字符串变量,并初始化为空;
由于以上三条伪指令用于定义全局变量,因此在整个程序范围内变量名必须唯一。
使用示例:
GBLA Test1;定义一个全局的数字变量,变量名为Test1
Test1 SETA 0xaa;将该变量赋值为0xaa
GBLL Test2;定义一个全局的逻辑变量,变量名为Test2
Test2 SETL {TRUE};将该变量赋值为真
GBLS Test3;定义一个全局的字符串变量,变量名为Test3
Test3 SETS “ Testing ”;将该变量赋值为“ Testing ”
2.LCLA、LCLL和LCLS
语法格式:
LCLA(LCLL或LCLS)局部变量名
LCLA、LCLL和LCLS伪指令用于定义一个ARM程序中的局部变量,并将其初始化。其中:
LCLA伪指令用于定义一个局部的数字变量,并初始化为0;
LCLL伪指令用于定义一个局部的逻辑变量,并初始化为F(假);
LCLS伪指令用于定义一个局部的字符串变量,并初始化为空;
以上三条伪指令用于声明局部变量,在其作用范围内变量名必须唯一。
使用示例:
LCLA Test4;声明一个局部的数字变量,变量名为Test4
Test3 SETA 0xaa;将该变量赋值为0xaa
LCLL Test5;声明一个局部的逻辑变量,变量名为Test5
Test4 SETL {TRUE};将该变量赋值为真
LCLS Test6;定义一个局部的字符串变量,变量名为Test6
Test6 SETS “ Testing ”;将该变量赋值为“ Testing ”
3.SETA、SETL和SETS
语法格式:
变量名SETA(SETL或SETS)表达式
伪指令SETA、SETL、SETS用于给一个已经定义的全局变量或局部变量赋值。
SETA伪指令用于给一个数学变量赋值;
SETL伪指令用于给一个逻辑变量赋值;
SETS伪指令用于给一个字符串变量赋值;
其中,变量名为已经定义过的全局变量或局部变量,表达式为将要赋给变量的值。
使用示例:
LCLA Test3;声明一个局部的数字变量,变量名为Test3
Test3 SETA 0xaa;将该变量赋值为0xaa
LCLL Test4;声明一个局部的逻辑变量,变量名为Test4
Test4 SETL {TRUE};将该变量赋值为真
4.RLIST
语法格式:
名称RLIST {寄存器列表}
RLIST伪指令可用于对一个通用寄存器列表定义名称,使用该伪指令定义的名称可在ARM指令LDM/STM中使用。在LDM/STM指令中,列表中的寄存器访问次序为根据寄存器的编号由低到高,而与列表中的寄存器排列次序无关。
使用示例:
RegList RLIST {R0-R5,R8,R10};将寄存器列表名称定义为RegList,可在ARM指令LDM/STM中通过该名称访问寄存器列表。