为什么会有atomic.LoadInt32

2021-12-14 09:12:05 浏览数 (1)

前些天我们聊了 Golang 内存对齐的话题,后来我突然想到另一个问题:为什么会有 atomic.LoadInt32?可能你觉得思维太跳跃了,容我慢慢道来:首先,有 atomic.LoadInt64 很正常,因为对一个 int64 来说,它的大小是 8 个字节,如果是 32 位平台的话(字长 4 字节),CPU 一次最多操作 4 个字节,需要两次才能拿到全部数据,所以封装一个 atomic.LoadInt64 来实现原子操作;但是,对一个 int32 数据来说,它的大小是 4 字节,不管是 32 位平台(字长 4 字节),还是 64 位平台(字长 8 字节),CPU 应该都可以保证一次操作拿到数据,换句话说,如果读取一个 int32 数据,那么本身就应该是原子的,可是为什么会有 atomic.LoadInt32,这不是脱了裤子放屁么?

有病没病走两步,让我们写一段代码来验证一下:

代码语言:javascript复制
package main

import "sync/atomic"

var v = int32(0)

func main() {
	var x int32
	x = v // main.go:9
	_ = x
	x = atomic.LoadInt32(&v) // main.go:11
	_ = x
}

通过「go tool compile」运行代码,拿到对应的汇编结果:

代码语言:javascript复制
shell> go tool compile -N -l -S main.go

0x0016 00022 (main.go:9)        MOVL    "".v(SB), AX
0x001c 00028 (main.go:9)        MOVL    AX, "".t 4(SP)
0x0020 00032 (main.go:11)       MOVL    "".v(SB), AX
0x0026 00038 (main.go:11)       MOVL    AX, "".t 4(SP)

不管是「x = v」还是「x = atomic.LoadInt32(&v)」,对应的汇编结果一摸一样,带着困惑,让我们继续看看是否能从 sync/atomic 的源代码中找到答案:

Golang 代码中只有函数声明,实际上是使用汇编实现的:

代码语言:javascript复制
// doc.go
func LoadInt32(addr *int32) (val int32)

// asm.s
TEXT ·LoadInt32(SB),NOSPLIT,$0
	JMP runtime∕internal∕atomic·Load(SB)

顺着路径,跳转到 runtime/internal/atomic,会发现每个平台都有独立的 Load 实现:

在 amd64 平台,Load 是用 Golang 实现的,等价于直接读取:

代码语言:javascript复制
func Load(ptr *uint32) uint32 {
	return *ptr
}

在 arm64 平台,Load 是用汇编实现的,并不是简单的一次操作:

代码语言:javascript复制
TEXT ·Load(SB),NOSPLIT,$0-12
	MOVD	ptr 0(FP), R0
	LDARW	(R0), R0
	MOVW	R0, ret 8(FP)
	RET

如上可见,atomic.LoadInt32 之所以存在,是因为某些平台存在特殊性,所以我们需要封装一个统一的操作,如此更有利于我们写出平台无关的代码。

本文仅讨论了 atomic 的原子性,实际上它还保证了可见性,有序性,有兴趣的朋友可以搜索内存屏障相关内容,这是一个很复杂的主题,我就不献丑了,推荐阅读:Golang Memory Model。

0 人点赞