还是上一篇中的例子来分析go的汇编
可以看到
代码语言:javascript复制>6 a:=1
b:=2
这两行代码对应的汇编代码为:
代码语言:javascript复制 >0x10a6d01 <main.main 33> movq $0x1,0x38(%rsp) │
│ 0x10a6d0a <main.main 42> movq $0x2,0x30(%rsp)
>代表当前代码所在的行。
AT&T格式的汇编代码中所有寄存器名字前面都有一个%符号,rsp代码sp寄存器,里面存的是栈顶指针。
目前使用最为广泛的AMD64这种体系结构的CPU,这种CPU共有20多个可以直接在汇编代码中使用的寄存器,其中有几个寄存器在操作系统代码中才会见到,而应用层代码一般只会用到如下分为三类的19个寄存器。
- 通用寄存器:rax, rbx, rcx, rdx, rsi, rdi, rbp, rsp, r8, r9, r10, r11, r12, r13, r14, r15寄存器。CPU对这16个通用寄存器的用途没有做特殊规定,程序员和编译器可以自定义其用途(下面会介绍,rsp/rbp寄存器其实是有特殊用途的);
- 程序计数寄存器(PC寄存器,有时也叫IP寄存器):rip寄存器。它用来存放下一条即将执行的指令的地址,这个寄存器决定了程序的执行流程;
- 段寄存器:fs和gs寄存器。一般用它来实现线程本地存储(TLS),比如AMD64 linux平台下go语言和pthread都使用fs寄存器来实现系统线程的TLS,在本章线程本地存储一节和第二章详细分析goroutine调度器的时候我们可以分别看到Linux平台下Pthread线程库和go是如何使用fs寄存器的。
上述这些寄存器除了fs和gs段寄存器是16位的,其它都是64位的,也就是8个字节,其中的16个通用寄存器还可以作为32/16/8位寄存器使用,只是使用时需要换一个名字,比如可以用eax这个名字来表示一个32位的寄存器,它使用的是rax寄存器的低32位。
rip寄存器
rip寄存器里面存放的是CPU即将执行的下一条指令在内存中的地址。
这里需要牢记的就是rip寄存器的值不是正在被CPU执行的指令在内存中的地址,而是紧挨这条正在被执行的指令后面那一条指令的地址。
rsp 栈顶寄存器和rbp栈基址寄存器
这两个寄存器都跟函数调用栈有关,其中rsp寄存器一般用来存放函数调用栈的栈顶地址,而rbp寄存器通常用来存放函数的栈帧起始地址,编译器一般使用这两个寄存器加一定偏移的方式来访问函数局部变量或函数参数
操作数宽度(即操作数的位数)
AT&T格式的汇编指令中如果有寄存器操作数,则根据寄存器的名字(比如rax, eax, ax, al分别代表64,32,16和8位寄存器)就可以确定操作数到底是多少位(8,16,32还是64位),所以不需要操作码后缀,如果没有寄存器操作数又是访存指令的话,则操作码需要加上后缀b、w、l或q来指定到底存取内存中的多少个字节。
而go汇编中,寄存器的名字没有位数之分,比如AX寄存器没有什么RAX, EAX之类的名字,指令中一律只能使用AX。所以如果指令中有操作数寄存器或是指令需要访问内存,则操作码都需要带上后缀B(8位)、W(16位)、D(32位)或Q(64位)。
立即操作数
立即操作数需要加上符号做前缀,如 "mov
寄存器间接寻址
寄存器间接寻址的格式为 offset(%register),如果offset为0,则可以略去偏移不写直接写成(%register)。何为间接寻址呢?其实就是指指令中的寄存器并不是真正的源操作数或目的操作数,寄存器的值是一个内存地址,这个地址对应的内存才是真正的源或目的操作数,比如 mov %rax, (%rsp)这条指令,第二个操作数(%rsp)中的寄存器的名字用括号括起来了,表示间接寻址,rsp的值是一个内存地址,这条指令的真实意图是把rax寄存器中的值赋值给rsp寄存器的值(内存地址)对应的内存,rsp寄存器本身的值不会被修改,作为比较,我们看一下 mov %rax, %rsp 这条指令 ,这里第二个操作数仅仅少了个括号,变成了直接寻址,意思完全不一样了,这条指令的意思是把rax的值赋给rsp,这样rsp寄存器的值被修改为跟rax寄存器一样的值了
TEXT runtime·gogo(SB):指明在代码区定义了一个名字叫gogo的全局函数(符号),该函数属于runtime包。
上面就是golang中常用的汇编代码。