要求熟悉一下6.828这门课的参考文献,为以后阅读和写汇编代码打基础。
注意特别提及的那片参考文献,讲解了两种汇编语言格式的不同之处。下面是这篇引文的小总结。
AT&T格式语法采用了一种独特的内联汇编技巧,下面是AT&T格式与Intel格式的不同之处。
编译器命名:采用前缀%
源操作数/目的操作数顺序:AT&T格式中源操作数总是在左边,目的操作数总是在右边。
下面是将eax加载进ebx的例子。
常量/立即数格式:所有的立即数、常量必须加前缀$
下面的例子是将C变量booga的地址加载到eax。这个地址是静态的。
操作符格式要求:必须用后缀b,w,或者l来明确目的寄存器的数据宽度,它们分别表示宽度为byte,word,或longword。如果不这样做,汇编语言编译器会猜。Intel格式中也有对应的方式,不说了。
引用内存:下面是标准的32为地址格式
它们相当与计算的内存位置为immed32+basepointer+indexpointer*indexscale
其他简单的内存定址格式:
定位特定C变量
AT&T:_booga
Intel:[_booga]
下划线"_"代表这是一个静态(全局)C变量。由于汇编和C是一起编译的,Unix和C语言某些变量名可能冲突,所以为了防止类似的符号名冲突,UNIX下的C语言就规定,C语言的源代码文件中的所有全局变量和函数经过编译后,相应的符号名前面会自动的加上下划线。这样做的好处,就是方便是程序开发人员,不用太小心翼翼的起名,避免了与汇编文件中的符号名的冲突。
定位寄存器的指向
AT&T:(%eax)
Intel:[eax]