c语言中伪指令,ARM汇编伪指令介绍（1）

ARM汇编伪指令介绍

在ARM汇编语言程序里，有一些特殊的助记符，这些助记符与指令系统的助记符不同，没有相对应的操作码，这些特殊指令助记符被称为伪指令，他们所完成的操作称为伪操作。伪指令在源程序中的作用是为完成汇编程序作各种准备工作的，这些伪指令仅在汇编过程中起作用，一旦汇编结束，伪指令的使命就完成。

在ARM的汇编程序中，有如下几种伪指令：符号定义伪指令、数据定义伪指令、汇编控制伪指令、宏指令以及其他伪指令。

1)其他常用的伪指令

还有一些其他的伪指令，在汇编程序中经常会被使用，包括以下几条：

— AREA

— ALIGN

— CODE16、CODE32

— ENTRY

— END

— EQU

— EXPORT(或GLOBAL)

— IMPORT

— EXTERN

— GET(或INCLUDE)

— INCBIN

— RN

— ROUT

1.AREA

语法格式：

AREA段名属性1，属性2，……

AREA伪指令用于定义一个代码段或数据段。其中，段名若以数字开头，则该段名需用“ | ”括起来，如|1_test|。

属性字段表示该代码段(或数据段)的相关属性，多个属性用逗号分隔。常用的属性如下：

— CODE属性：用于定义代码段，默认为READONLY。

— DATA属性：用于定义数据段，默认为READWRITE。

— READONLY属性：指定本段为只读，代码段默认为READONLY。

— READWRITE属性：指定本段为可读可写，数据段的默认属性READWRITE。

— ALIGN属性：使用方式为ALIGN表达式。在默认时，ELF(可执行连接文件)的代码段和数据段是按字对齐的，表达式的取值范围为0～31，相应的对齐方式为2表达式次方。

— COMMON属性：该属性定义一个通用的段，不包含任何的用户代码和数据。各源文件中同名的COMMON段共享同一段存储单元。

一个汇编语言程序至少要包含一个段，当程序太长时，也可以将程序分为多个代码段和数据段。

使用示例：

AREA Init，CODE，READONLY

该伪指令定义了一个代码段，段名为Init，属性为只读

2.ALIGN

语法格式：

ALIGN {表达式{，偏移量}}

ALIGN伪指令可通过添加填充字节的方式，使当前位置满足一定的对其方式|。其中，表达式的值用于指定对齐方式，可能的取值为2的幂，如1、2、4、8、16等。若未指定表达式，则将当前位置对齐到下一个字的位置。偏移量也为一个数字表达式，若使用该字段，则当前位置的对齐方式为：2的表达式次幂＋偏移量。

使用示例：

AREA Init，CODE，READONLY，ALIEN＝3；指定后面的指令为8字节对齐。

指令序列

END

3.CODE16、CODE32

语法格式：

CODE16(或CODE32)

CODE16伪指令通知编译器，其后的指令序列为16位的Thumb指令。

CODE32伪指令通知编译器，其后的指令序列为32位的ARM指令。

若在汇编源程序中同时包含ARM指令和Thumb指令时，可用CODE16伪指令通知编译器其后的指令序列为16位的Thumb指令，CODE32伪指令通知编译器其后的指令序列为32位的ARM指令。因此，在使用ARM指令和Thumb指令混合编程的代码里，可用这两条伪指令进行切换，但注意他们只通知编译器其后指令的类型，并不能对处理器进行状态的切换。

使用示例：

AREA Init，CODE，READONLY

……

CODE32；通知编译器其后的指令为32位的ARM指令

LDR R0，＝NEXT＋1；将跳转地址放入寄存器R0

BX R0；程序跳转到新的位置执行，并将处理器切换到Thumb工作状态

……

CODE16；通知编译器其后的指令为16位的Thumb指令

NEXT LDR R3，＝0x3FF

……

END；程序结束

4.ENTRY

语法格式：

ENTRY

ENTRY伪指令用于指定汇编程序的入口点。在一个完整的汇编程序中至少要有一个ENTRY(也可以有多个，当有多个ENTRY时，程序的真正入口点由链接器指定)，但在一个源文件里最多只能有一个ENTRY(可以没有)。

使用示例：

AREA Init，CODE，READONLY

ENTRY；指定应用程序的入口点

……

5.END

语法格式：

END

END伪指令用于通知编译器已经到了源程序的结尾。

使用示例：

AREA Init，CODE，READONLY

……

END；指定应用程序的结尾

6.EQU

语法格式：

名称EQU表达式{，类型}

EQU伪指令用于为程序中的常量、标号等定义一个等效的字符名称，类似于C语言中的＃define。

其中EQU可用“ * ”代替。

名称为EQU伪指令定义的字符名称，当表达式为32位的常量时，可以指定表达式的数据类型，可以有以下三种类型：

CODE16、CODE32和DATA

使用示例：

Test EQU 50；定义标号Test的值为50

Addr EQU 0x55，CODE32；定义Addr的值为0x55，且该处为32位的ARM令。

7.EXPORT(或GLOBAL)

语法格式：

EXPORT标号{[WEAK]}

EXPORT伪指令用于在程序中声明一个全局的标号，该标号可在其他的文件中引用。EXPORT可用GLOBAL代替。标号在程序中区分大小写，[WEAK]选项声明其他的同名标号优先于该标号被引用。

使用示例：

AREA Init，CODE，READONLY

EXPORT Stest；声明一个可全局引用的标号Stest……

END

8.IMPORT

语法格式：

IMPORT标号{[WEAK]}

IMPORT伪指令用于通知编译器要使用的标号在其他的源文件中定义，但要在当前源文件中引用，而且无论当前源文件是否引用该标号，该标号均会被加入到当前源文件的符号表中。

标号在程序中区分大小写，[WEAK]选项表示当所有的源文件都没有定义这样一个标号时，编译器也不给出错误信息，在多数情况下将该标号置为0，若该标号为B或BL指令引用，则将B或BL指令置为NOP操作。

使用示例：

AREA Init，CODE，READONLY

IMPORT Main；通知编译器当前文件要引用标号Main，但Main在其他源文件中定义……

END

9.EXTERN

语法格式：

EXTERN标号{[WEAK]}

EXTERN伪指令用于通知编译器要使用的标号在其他的源文件中定义，但要在当前源文件中引用，如果当前源文件实际并未引用该标号，该标号就不会被加入到当前源文件的符号表中。标号在程序中区分大小写，[WEAK]选项表示当所有的源文件都没有定义这样一个标号时，编译器也不给出错误信息，在多数情况下将该标号置为0，若该标号为B或BL指令引用，则将B或BL指令置为NOP操作。

使用示例：

AREA Init，CODE，READONLY

EXTERN Main；通知编译器当前文件要引用标号Main，但Main在其他源文件中定义……

END

10.GET(或INCLUDE)

语法格式：

GET文件名

GET伪指令用于将一个源文件包含到当前的源文件中，并将被包含的源文件在当前位置进行汇编处理。可以使用INCLUDE代替GET。

汇编程序中常用的方法是在某源文件中定义一些宏指令，用EQU定义常量的符号名称，用MAP和FIELD定义结构化的数据类型，然后用GET伪指令将这个源文件包含到其他的源文件中。使用方法与C语言中的“ include ”相似。

GET伪指令只能用于包含源文件，包含目标文件需要使用INCBIN伪指令

使用示例：

AREA Init，CODE，READONLY

GET a1.s；通知编译器当前源文件包含源文件a1.s

GE T C：\a2.s；通知编译器当前源文件包含源文件C：\ a2.s ……

END

11.INCBIN

语法格式：

INCBIN文件名

INCBIN伪指令用于将一个目标文件或数据文件包含到当前的源文件中，被包含的文件不作任何变动的存放在当前文件中，编译器从其后开始继续处理。

使用示例：

AREA Init，CODE，READONLY

INCBIN a1.dat；通知编译器当前源文件包含文件a1.dat

INCBIN C：\a2.txt；通知编译器当前源文件包含文件C：\a2.txt……

END

12.RN

语法格式：

名称RN表达式

RN伪指令用于给一个寄存器定义一个别名。采用这种方式可以方便程序员记忆该寄存器的功能。其中，名称为给寄存器定义的别名，表达式为寄存器的编码。

使用示例：

Temp RN R0；将R0定义一个别名Temp

13.ROUT

语法格式：

{名称} ROUT

ROUT伪指令用于给一个局部变量定义作用范围。在程序中未使用该伪指令时，局部变量的作用范围为所在的AREA，而使用ROUT后，局部变量的作为范围为当前ROUT和下一个ROUT之间。

2)ARM杂项伪指令

1.ADR伪指令：小范围的地址读取伪指令。

ADR指令将基于PC相对偏移的地址值读取到寄存器中。在汇编编译源程序时，ADR伪指令被编译器替换成一条合适的指令。通常编译器用一条ADD指令或SUB指令来实现该ADR伪指令的功能。

指令格式：ADR{cond} register ,expr

Register加载的寄存器

Expr程序相对偏移或寄存器相对偏移的表达式

非字对齐地址在-255～255字节范围内；

字对齐地址在-1020～1020字节范围内。

举例：

Start MOV R1，#10

ADR R4，start ;相当于PC-10后赋值给R4

2.ADRL指令：中等范围的地址读取伪指令。

ADRL指令将基于PC相对偏移的地址值或基于相对偏移的地址值读取到寄存器中，比ADR伪指令可读取更大范围的地址。在汇编编译源程序时，ADRL伪指令被编译器替换成两条合适的指令。若不能用两条指令实现ADRL伪指令功能，则产生错误，编译失败。

指令格式与ADR相同

非字对齐地址在64K字节范围内；

字对齐地址在256K字节范围内。

举例：

Start MOV R1，#10

ADR R4，start+6000 ;=>ADD R4,PC,#0xe800 ADD R4,R4,#0x254

3.LDR指令大范围的地址读取伪指令

LDR伪指令用于加载32位的立即数或一个地址值到指定寄存器。

在汇编编译源程序时，LDR指令被编译器替换成一条合适的指令，若加载的常数未超出MOV或MVN的范围，则使用MOV或MVN指令代替该LDR伪指令，否则汇编器将常量放入字池(内存)，并使用一条程序相对偏移的LDR指令从文字池读出常量。

指令格式：LDR {cond} register , = expr/label_expr

Expr32位立即数

Label_expr基于PC的地址表达式或外部表达式

举例

LDR R0，=0x123987；加载32位立即数

LDR R0，=DATA_BUF+60；加载DATA_BUF地址+60

4.NOP指令

NOP指令产生所需的ARM无操作代码。可以使用指令MOV R0，R0。NOP不能有条件使用。执行和不执行无操作指令是一样的，因而不需要有条件执行。ALU状态不受NOP影响。

3)符号定义( Symbol Definit年ion)伪指令

符号定义伪指令用于定义ARM汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。

常见的符号定义伪指令有如下几种：

Ø用于定义全局变量的GBLA、GBLL和GBLS

Ø用于定义局部变量的LCLA、LCLL和LCLS

Ø用于对变量赋值的SETA、SETL、SETS

Ø为通用寄存器列表定义名称的RLIST

1.GBLA、GBLL和GBLS

语法格式：

GBLA(GBLL或GBLS)全局变量名

GBLA、GBLL和GBLS伪指令用于定义一个ARM程序中的全局变量，并将其初始化。其中：

GBLA伪指令用于定义一个全局的数字变量，并初始化为0；

GBLL伪指令用于定义一个全局的逻辑变量，并初始化为F(假)；

GBLS伪指令用于定义一个全局的字符串变量，并初始化为空；

由于以上三条伪指令用于定义全局变量，因此在整个程序范围内变量名必须唯一。

使用示例：

GBLA Test1；定义一个全局的数字变量，变量名为Test1

Test1 SETA 0xaa；将该变量赋值为0xaa

GBLL Test2；定义一个全局的逻辑变量，变量名为Test2

Test2 SETL {TRUE}；将该变量赋值为真

GBLS Test3；定义一个全局的字符串变量，变量名为Test3

Test3 SETS “ Testing ”；将该变量赋值为“ Testing ”

2.LCLA、LCLL和LCLS

语法格式：

LCLA(LCLL或LCLS)局部变量名

LCLA、LCLL和LCLS伪指令用于定义一个ARM程序中的局部变量，并将其初始化。其中：

LCLA伪指令用于定义一个局部的数字变量，并初始化为0；

LCLL伪指令用于定义一个局部的逻辑变量，并初始化为F(假)；

LCLS伪指令用于定义一个局部的字符串变量，并初始化为空；

以上三条伪指令用于声明局部变量，在其作用范围内变量名必须唯一。

使用示例：

LCLA Test4；声明一个局部的数字变量，变量名为Test4

Test3 SETA 0xaa；将该变量赋值为0xaa

LCLL Test5；声明一个局部的逻辑变量，变量名为Test5

Test4 SETL {TRUE}；将该变量赋值为真

LCLS Test6；定义一个局部的字符串变量，变量名为Test6

Test6 SETS “ Testing ”；将该变量赋值为“ Testing ”

3.SETA、SETL和SETS

语法格式：

变量名SETA(SETL或SETS)表达式

伪指令SETA、SETL、SETS用于给一个已经定义的全局变量或局部变量赋值。

SETA伪指令用于给一个数学变量赋值；

SETL伪指令用于给一个逻辑变量赋值；

SETS伪指令用于给一个字符串变量赋值；

其中，变量名为已经定义过的全局变量或局部变量，表达式为将要赋给变量的值。

使用示例：

LCLA Test3；声明一个局部的数字变量，变量名为Test3

Test3 SETA 0xaa；将该变量赋值为0xaa

LCLL Test4；声明一个局部的逻辑变量，变量名为Test4

Test4 SETL {TRUE}；将该变量赋值为真

4.RLIST

语法格式：

名称RLIST {寄存器列表}

RLIST伪指令可用于对一个通用寄存器列表定义名称，使用该伪指令定义的名称可在ARM指令LDM/STM中使用。在LDM/STM指令中，列表中的寄存器访问次序为根据寄存器的编号由低到高，而与列表中的寄存器排列次序无关。

使用示例：

RegList RLIST {R0-R5，R8，R10}；将寄存器列表名称定义为RegList，可在ARM指令LDM/STM中通过该名称访问寄存器列表。

c语言中 伪指令,ARM汇编伪指令介绍（1）

c语言中伪指令,ARM汇编伪指令介绍（1）