问:想学汇编语言,因为现在用的是linux系统(ubuntu 11.04),so
有一本《汇编语言程序设计》马朝晖译,可惜淘宝、当当、京东等都没货,淘宝上只有盗版的。
ARM的书倒是挺多(但是我不是搞嵌入式的),二者有什么区别?语法一样否?汇编器都是gas?如果学习linux内核,二者是否通用?
学汇编语言(linux平台的最好),有啥经典大作(中文的吧,英语不好)?
答1:at&t汇编是x86处理器的,arm汇编当然是arm处理器的,完全不一样,也没法通用。
学汇编先要学处理器结构。别的不说,x86的寄存器是eax、ebx、……,arm的是r0、r1、……
如果不搞嵌入式,我觉得还是学x86比较好
答2:
如果不是做驱动和底层安全领域,建议不要花大精力学汇编。
而且由于汇编和处理器架构有关。换平台不易。
AT&T汇编和GNU汇编也有区别。
建议楼主还是学习操作系统底层的编程技术吧?
没事研究研究Linux Kernel还是挺有前途的。
转自:https://bbs.csdn.net/topics/370232628
ARM汇编开发指用ARM提供的汇编指令,进行ARM程序的开发。
ARM汇编开发,有两种开发方式,一种是使用ARM汇编,一种是使用ARM GNU汇编。两种汇编开发,使用的汇编指令是完全一样的,区别是宏指令,伪指令,伪操作不一样。其实两种开发方式的区别在于所使用的编译工具不一样。
对于ARM汇编,使用的是ARM公司开发的编译器,而ARM GNU汇编,是使用GNU为ARM指令集开发的编译器,也就是arm-gcc。
两种常用的ARM的编译开发环境
DS5:ARM提供的集成开发软件。使用的是ARM提供的工具链进行程序编译
GNU开发环境: 由GNU的汇编器as,交叉编译器gcc,和链接器ld等组成
伪操作:ARM汇编语言程序里的一些特殊指令助记符,其作用主要是完成汇编程序做各种准备工作,在源程序进行汇编时由汇编程序处理,而不是在计算机运行期间由机器执行。如程序段的定义,就属于伪操作。
宏指令:一段独立的程序代码,可插在源程序中,通过伪操作来定义。
伪指令:ARM汇编语言程序里的一些特殊指令助记符,不在处理器运行期间执行,在汇编时,被合适的ARM的机器指令代替,从而实现真正的指令操作。
伪操作 | 语法格式 | 作用 |
GBLA | GBLA Varible | 声明一个全局的算术变量,并将其初始化为0 |
GBLL | GBLL Varible | 声明一个全局的逻辑变量,并将其初始化成{FALSE} |
GBLS | GBLS Varible | 声明一个全局的字符串变量,并将其初始化成空串 |
LCLA | LCLA Varible | 声明一个局部的算术变量,并将其初始化为0 |
LCLL | LCLL Varible | 声明一个局部的逻辑变量,并将其初始化成{FALSE} |
LCLS | LCLS Varible | 声明一个局部的字符串变量,并将其初始化成空串 |
SETA | SETA Varible expr | 给一个全局或局部算术变量赋值 |
SETL | SETL Varible expr | 给一个全局或局部逻辑变量赋值 |
SETS | SETS Varible expr | 给一个全局或局部字符串变量赋值 |
RLIST | name LIST {list of registers} | 为一个通用寄存器列表定义名称 |
CN | name CN expr | 为一个协处理器的寄存器定义名称 |
CP | name CP expr | 为一个协处理器定义名称 |
DN/SN | name DN/SN expr | DN/SN为一个双精度/单精度的VFP寄存器定义名称 |
FN | name FN expr | 为一个FPA浮点寄存器定义名称 |
LTORG | LTONG | 声明一个数据缓冲池(文字池)的开始 |
MAP | MAP expr {, base-register} | 定义一个结构化的内存表(storage map)的首地址 |
FIELD | {label} FIELF expr | 定义一个结构化内存表中的数据域 |
SPACE | {label} SPACE expr | 分配一块连续内存单元,并用0初始化 |
DCB | {label} DCB expr {,expr}.. | 分配一块字节内存单元,并用expr初始化 |
DCD/ DCDU | {label} DCD/DCDU expr {,expr}… | 分配一块字内存单元, 并用expr初始化 |
DCDO | {label} DCDO expr {,expr}… | 分配一块字对齐的字内存单元, 并用expr初始化 |
DCFD/DCFDU | {label} DCFD{U} fpliteral ,{,fpliteral}… | 为双精度的浮点数分配字对齐的内存单元 |
DCFS/DCFSU | {label} DCFS{U} fpliteral ,{,fpliteral}… | 为单精度的浮点数分配字对齐的内存单元 |
DCI | {label} DCI expr, {expr}… | ARM代码分配一段字对齐的内存单元,填充expr(二进制指令码),THUMB代码中,分配一段半字对齐的半字内存单元。 |
DCQ/ DCQU | {label} DCQ{U} {-} literal, {, {-} literal}… | 分配一段以双字(8个字节)为单位的内存 |
DCW/DCWU | {label} DCW{U} {-} literal, {, {-} literal}… | DCW用于分配一段半字对齐的半字内存单元 |
创建一段新的程序代码或数据区。
格式 : AREA name, {,attr,} …
其中,name是程序段名, atrr是段名属性
对于属性,有以下一些:
CODE: 用于定义代码段,默认为是READONLY
DATA: 用于定于数据段,默认为READWRITE
READONLY: 指定本段的内容只读
READWRITE: 指定本段的内容可读可写
ALIGN: 指定对齐为2次幂
COMMON: 定义通用的段。不包含任何用户的代码和数据。各源文件中同名的COMMON属性段共享同一段存储单元
指定对齐
ALIGN 4 表示4字节地址对齐
ALIGN 8 表示8字节地址对齐
注意:在AREA中使用和单独使用ALIGN的区别,在于格式和对齐的计算不一样。
指定汇编程序的入口。
一个程序至少有一个入口点,也可以有多个入口点,但是在一个源文件中,最多只能有一个ENTRY。当多个源文件均有ENTRY时,由链接器指定程序真正的入口。
表示源程序的结束
所以汇编语言源文件必须以END结束,汇编器遇到END, 将结束编译。
格式: EXPORT 标号 [,WEAK]
声明一个全局标号,其他源文件可以使用这个标号。WEAK表示碰上其他同名标号时,其他标号优先。
格式: IMPORT 标号,[,WEAK]
表示该引用的标号在其他源文件中,单要在当前文件中引用。WEAK表示找不到该标号时,也不报错,一般该标号置为0,如果是B 或BL指令用到该标号,该指令置为nop。
该标号会加入到当前源文件的符号表中。
和IMPORT一样,不同在于,如果当前文件没有引用该标号,该标号不会加入到当前源文件的符号表中。
将一个源文件包含到当前的源文件中
对一个常量标号赋值
格式: name EQU expression
其中: name符号名, expression寄存器相关或者程序相关的固定值
如:
num EQU 2 ; 为符号赋予数字2
EQU,等同于C语言中用#define定义一个常量
用于分配一片连续内存单元,并用0初始化。SPACE可用%代替。
格式: {label} SPACE expr
label : 是一个标号, 可选
expr: 分配的内存字节数
如
stack SPACE 100 ; 分配100个字节内存单元,并用0初始化。标号stack是这片空间的起始地址
用于分配段字节内存单元,并用伪操作中的expr初始化。
格式: {label} DCB expr {,expr}
label: 是一个标号,可选
expr: 可以是-128~255的数值或者字符串
如:
string DCB "HELLO" ;为HELLO字符串分配空间, string是这块空间的起始地址
用于分配段字内存单元(分配的内存都是字对齐,DCDU并不严格字对齐),并用伪操作中的expr初始化。 DCD 可用 & 代替。
格式: {label} DCD expr, {,expr}
label: 是一个标号,可选,表示这块内存单元的首地址
expr: 数字表达式或程序中的标号
如:
data DCD 1,2,3,4 ;分配字对齐的字单元空间,初始化为1,2,3,4
ARM伪指令包括: ADR, ADRL,LDR ,NOP
THUMB伪指令包括:ADR, LDR, NOP
伪指令 | 语法格式 | 作用 |
ADR | ADR{cond} register, expr | 将基于PC或基于寄存器的地址值读取到寄存器中。小范围的地址读取 |
ADRL | ADRL{cond} register, expr | 将给予PC或基于寄存器的地址值读取到寄存器中。中等范围的地址读取 |
LDR | LDR {cond} register, =[expr|label] | 将一个32位的立即数或者一个地址值读取到寄存器中。大范围的地址读取 |
NON | NOP | 在汇编时,被替换成空操作 |
伪操作 | 语法格式 | 作用 |
.byte | .byte expr {,expr}… | 分配一段字节内存单元,并用expr初始化 |
.hword/.short | .hword expr {,expr}… | 分配一段半字内存单元,并用expr初始化 |
.ascii | .ascii expr {,expr}… | 定义字符串expr |
.asciz/.string | .asciz expr {,expr}… | 定义字符串expr(会增加/0为结束符) |
.floar/.single | .float expr {,expr}… | 定义32bit IEEE浮点数expr |
.double | .doubel expr {,expr}… | 定义64bit IEEE浮点数expr |
.word/.long/.int | .word expr {,expr}… | 分配一段字内存单元,并用expr初始化 |
.fill | .fill repeat {,size} {,value} | 分配一段字节内存单元,用sieze长度value填充repeat次 |
.zero | .zero size | 分配一段字节内存单元,并用0填充内存 |
.space/.skip | .space size, {,value} | 分配一段内存单元,用value将内存初始化 |
.section | .section expr | 定义一个段 |
.text | .text {subsection} | 代码段, |
.data | .data{subsection} | 数据段 |
.bss | .bss{subsection} | bss段 |
.cond 16/.thumb | .code 16/.thumb | 表示之后的汇编指令使用THUMB指令集 |
.code 32/.arm | .code 32/.arm | 表示之后的汇编指令使用ARM指令集 |
.end | .end | 标记汇编文件的结束 |
.include | .include "filename" | 将一个源文件包含到当前源文件中 |
.align/.balign | .align {alignment} {,fill},{max} | 通过填充字节使当前位置满足一定的对齐格式 |
两种开发环境下的汇编代码,有较多不同的点,主要是符号及伪操作的不同。
ARM汇编的伪操作符 | GNU汇编的伪操作符 |
INLCUDE | .include |
NUM EQU 25 | .equ NUM, 25 |
EXPORT | .global |
IMPORT | .extern |
DCD | .long |
IF: DEF: | .ifdef |
ELSE | .else |
ENDIF | .endif |
OR | | |
SHL | << |
RN | .req |
GBLA | .global |
NUM SETA 16 | .equ NUM , 16 |
MACRO | .macro |
MEND | .endm |
END | .end |
AREA WORD, CODE, READONLY | .text |
AREA BLOCK, DATE, READWRITE | .data |
CODE32 | .arm |
CODE16 | .thumb |
LTORG | .ltorg |
% | .fill |
ENTRY | ENTRY: |
ldr x0,=0xff | ldr x0,=0xff |