切片结构
代码语言:javascript复制type slice struct {
array unsafe.Pointer
len int
cap int
}
代码语言:javascript复制a = make([]int, 0)
unsafe.Sizeof(a) // 24
切片组成元素:
- 指针:指向底层数组
- 长度:切片中元素的长度,不能大于容量
- 容量:指针所指向的底层数组的总容量
初始化方式
- 使用make
slice := make([]int, 5) // 初始化长度和容量都为 5 的切片
slice := make([]int, 5, 10) // 初始化长度为 5, 容量为 10 的切片
使用 make
关键字创建切片时,很多工作都需要运行时的参与;调用方必须在 make
函数中传入一个切片的大小以及可选的容量,cmd/compile/internal/gc.typecheck1
会对参数进行校验:
func typecheck1(n *Node, top int) (res *Node) {
switch n.Op {
...
case OMAKE:
args := n.List.Slice()
i := 1
switch t.Etype {
case TSLICE:
if i >= len(args) {
yyerror("missing len argument to make(%v)", t)
return n
}
l = args[i]
i
var r *Node
if i < len(args) {
r = args[i]
}
...
if Isconst(l, CTINT) && r != nil && Isconst(r, CTINT) && l.Val().U.(*Mpint).Cmp(r.Val().U.(*Mpint)) > 0 {
yyerror("len larger than cap in make(%v)", t)
return n
}
n.Left = l
n.Right = r
n.Op = OMAKESLICE
}
...
}
}
上述函数不仅会检查 len
是否传入,还会保证传入的容量 cap
一定大于或者等于 len
,除了校验参数之外,当前函数会将 OMAKE
节点转换成 OMAKESLICE
,随后的中间代码生成阶段在 cmd/compile/internal/gc.walkexpr
函数中的 OMAKESLICE
分支依据两个重要条件对这里的 OMAKESLICE
进行转换:
- 切片的大小和容量是否足够小;
- 切片是否发生了逃逸,最终在堆上初始化
虽然大多的错误都可以在编译期间被检查出来,但是在创建切片的过程中如果发生了以下错误就会直接导致程序触发运行时错误并崩溃:
- 内存空间的大小发生了溢出;
- 申请的内存大于最大可分配的内存;
- 传入的长度小于 0 或者长度大于容量;
runtime.makeslice
在最后调用的 runtime.mallocgc
是用于申请内存的函数,这个函数的实现比较复杂,如果遇到了比较小的对象会直接初始化在 Go 语言调度器里面的 P 结构中,而大于 32KB 的对象会在堆上初始化
- 为啥是32kb
- 界限的选择是基于一些性能和内存管理的考虑。
- 小于等于32KB的对象被认为是比较小的,可以在 P 结构中进行初始化。这样做有以下几个优点:
- 减少对堆的访问:将对象初始化在 P 结构中可以避免频繁地访问堆,减少内存的分配和释放操作,提高程序的性能。
- 提高局部性:将对象与对应的 P 结构关联起来,可以提高数据的局部性,减少内存访问的延迟,进一步提升性能。
- 大于32KB的对象被认为是较大的对象,其内存需求比较高。将这些对象直接初始化在堆上有以下几个优点:
- 堆的管理更加灵活:堆提供了更加灵活的内存管理机制,可以根据需要动态分配和释放内存,适应各种大小的对象。
- 避免过度占用 P 结构:将大对象初始化在堆上可以避免过度占用 P 结构的内存空间,保持 P 结构的高效利用。使用简短定义
代码语言:javascript复制slice := []int{1, 2, 3}
- 使用数组来初始化切片
arr := [5]int{1, 2, 3, 4, 5}
slice := arr[0:3] // 左闭右开区间,最终切片为 [1,2,3]
cap(slice) // 长度为5,更通用的规则是:一个切片的容量可以被看作是透过这个窗口最多可以看到的底层数组中元素的个数。注意,切片代表的窗口是无法向左扩展的。
- 使用切片来初始化切片
sliceA := []int{1, 2, 3, 4, 5}
sliceB := sliceA[0:3] // 左闭右开区间,sliceB 最终为 [1,2,3]
扩容例子
- 注意点
- 多个切片共享一个底层数组的情况,对底层数组的修改,将影响上层多个切片的值
- 多个切片共享一个底层数组的情况,对底层数组的修改,原有的切片发生了扩容 底层数组被重新创建 ,和原来的切片已经没有关系了
- 扩容的slice还和类型(其实是类型占的字节)有关
e := []int32{1,2,3}
fmt.Println("cap of e before:",cap(e))
e = append(e,4)
fmt.Println("cap of e after:",cap(e))
f := []int{1,2,3}
fmt.Println("cap of f before:",cap(f))
f = append(f,4)
fmt.Println("cap of f after:",cap(f))
cap of e before: 3
cap of e after: 8
cap of f before: 3
cap of f after: 6
代码语言:javascript复制package main
import (
"fmt"
)
func main() {
slice := []int{1, 2, 3, 4, 5}
newSlice := slice[0:3]
fmt.Println("before modifying underlying array:")
fmt.Println("slice: ", slice)
fmt.Println("newSlice: ", newSlice)
fmt.Println()
newSlice[0] = 6
// 如果是newSlice append几个元素进去,则slice的值为 6,1,2,3,4,5
fmt.Println("after modifying underlying array:")
fmt.Println("slice: ", slice)
fmt.Println("newSlice: ", newSlice)
}
以上代码预期输出如下:
代码语言:javascript复制before modify underlying array:
slice: [1 2 3 4 5]
newSlice: [1 2 3]
after modify underlying array:
slice: [6 2 3 4 5]
newSlice: [6 2 3]
使用 copy 方法可以避免共享同一个底层数组
代码语言:javascript复制package main
import (
"fmt"
)
func main() {
slice := []int{1, 2, 3, 4, 5}
newSlice := make([]int, len(slice))
copy(newSlice, slice)
fmt.Println("before modifying underlying array:")
fmt.Println("slice: ", slice)
fmt.Println("newSlice: ", newSlice)
fmt.Println()
newSlice[0] = 6
fmt.Println("after modifying underlying array:")
fmt.Println("slice: ", slice)
fmt.Println("newSlice: ", newSlice)
}
以上代码预期输出如下:
代码语言:javascript复制before modifying underlying array:
slice: [1 2 3 4 5]
newSlice: [1 2 3 4 5]
after modifying underlying array:
slice: [1 2 3 4 5]
newSlice: [6 2 3 4 5]
扩容分析
通过 append
关键字被转换的控制流了解了在切片容量足够时如何向切片中追加元素,但是当切片的容量不足时就会调用 runtime.growslice
函数为切片扩容,扩容就是为切片分配一块新的内存空间并将原切片的元素全部拷贝过去,我们分几部分分析该方法:
func growslice(et *_type, old slice, cap int) slice {
// ……
newcap := old.cap
doublecap := newcap newcap
if cap > doublecap {
newcap = cap
} else {
if old.cap < 1024 {
newcap = doublecap
} else {
for newcap < cap {
newcap = newcap / 4
}
}
}
// ……
capmem = roundupsize(uintptr(newcap) * ptrSize)
newcap = int(capmem / ptrSize)
}
后半部分还对 newcap
作了一个内存对齐
,这个和内存分配策略相关。进行内存对齐之后,新 slice 的容量是要 大于等于
老 slice 容量的 2倍
或者1.25倍
。
package main
import "fmt"
func main() {
s := []int{1,2}
s = append(s,4,5,6)
fmt.Printf("len=%d, cap=%d",len(s),cap(s))
}
运行结果是:
代码语言:javascript复制len=5, cap=6 (如果按照1.25倍的说法就是5,8,但实际上是错误的)
这个函数的参数依次是 元素的类型,老的 slice,新 slice 最小求的容量。
例子中 s 原来只有 2 个元素,len 和 cap 都为 2,append 了三个元素后,长度变为 5,容量最小要变成 5,即调用 growslice 函数时,传入的第三个参数应该为 5。即 cap=5。而一方面,doublecap 是原 slice容量的 2 倍,等于 4。满足第一个 if 条件,所以 newcap 变成了 5。 接着调用了 roundupsize 函数,传入 40。(代码中ptrSize是指一个指针的大小,在64位机上是8)
再看内存对齐,搬出 roundupsize 函数的代码:
代码语言:javascript复制func roundupsize(size uintptr) uintptr {
if size < _MaxSmallSize {
if size <= smallSizeMax-8 {
return uintptr(class_to_size[size_to_class8[(size smallSizeDiv-1)/smallSizeDiv]])
} else {
//……
}
}
//……
}
const _MaxSmallSize = 32768
const smallSizeMax = 1024
const smallSizeDiv = 8
最终返回
代码语言:javascript复制class_to_size[size_to_class8[(size smallSizeDiv-1)/smallSizeDiv]]
这是 Go 源码中有关内存分配的两个 slice。class_to_size通过 spanClass获取 span划分的 object大小。而 size_to_class8 表示通过 size 获取它的 spanClass。
代码语言:javascript复制var size_to_class8 = [smallSizeMax/smallSizeDiv 1]uint8{0, 1, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8, 9, 9, 10, 10, 11, 11, 12, 12, 13, 13, 14, 14, 15, 15, 16, 16, 17, 17, 18, 18, 18, 18, 19, 19, 19, 19, 20, 20, 20, 20, 21, 21, 21, 21, 22, 22, 22, 22, 23, 23, 23, 23, 24, 24, 24, 24, 25, 25, 25, 25, 26, 26, 26, 26, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 27, 27, 28, 28, 28, 28, 28, 28, 28, 28, 29, 29, 29, 29, 29, 29, 29, 29, 30, 30, 30, 30, 30, 30, 30, 30, 30, 30, 30, 30, 30, 30, 30, 30, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31}
var class_to_size = [_NumSizeClasses]uint16{0, 8, 16, 32, 48, 64, 80, 96, 112, 128, 144, 160, 176, 192, 208, 224, 240, 256, 288, 320, 352, 384, 416, 448, 480, 512, 576, 640, 704, 768, 896, 1024, 1152, 1280, 1408, 1536, 1792, 2048, 2304, 2688, 3072, 3200, 3456, 4096, 4864, 5376, 6144, 6528, 6784, 6912, 8192, 9472, 9728, 10240, 10880, 12288, 13568, 14336, 16384, 18432, 19072, 20480, 21760, 24576, 27264, 28672, 32768}
我们传进去的 size 等于 40。所以 (size smallSizeDiv-1)/smallSizeDiv = 5;获取 size_to_class8 数组中索引为 5 的元素为 4;获取 class_to_size 中索引为 4 的元素为 48。
最终,新的 slice 的容量为 6:
代码语言:javascript复制newcap = int(capmem / ptrSize) // 6
- 预估容量(预估"元素个数")
注意:(官方代码在2020-09-25 换成了 if old.cap < 1024{} )
- 如果新申请容量(cap)大于旧容量(old.cap)的两倍,则最终容量(newcap)是新申请的容量(cap);
- 如果旧切片的长度小于 1024,则最终容量是旧容量的 2 倍,即“newcap=doublecap”;
- 如果旧切片的长度大于或等于 1024,则最终容量从旧容量开始循环增加原来的 1/4,直到最终容量大于或等于新申请的容量为止;
- 如果最终容量计算值溢出,即超过了 int 的最大范围,则最终容量就是新申请容量。
- 分配内存 = 预估容量 * 元素类型大小
申请分配内存是语言自身实现的内存管理模块向操作系统申请(合适的内存规格:8,16,32,48,64,80,96,112......字节,64位下每个元素占16字节。32位下占8字节,其中查看类型占多少字节用unsafe.Sizeof()来判断,但是又如何得知当前平台是在处于多少为的系统。可以用以下来判断(比如int在64为下占8个字节,string在64为下占10个字节)
代码语言:javascript复制32 << (^uint(0) >> 63)
^uint(0)在32位系统上返回的是0XFFFFFFFF, 也就是2^32, 在64位系统上返回的是0xFFFFFFFFFFFFFFFF, 也就是2^64
申请分配内存会匹配到最接近的规格
- newCap = 申请分配内存 / 元素类型大小
拷贝切片
当我们使用 copy(a, b)
的形式对切片进行拷贝时,编译期间的 cmd/compile/internal/gc.copyany
函数也会分两种情况进行处理,如果当前 copy
不是在运行时调用的,copy(a, b)
会被直接转换成下面的代码:
之后,向 Go 内存管理器申请内存,将老 slice 中的数据复制过去,并且将 append 的元素添加到新的底层数组中。
最后,向 growslice
函数调用者返回一个新的 slice,这个 slice 的长度并没有变化,而容量却增大了。
n := len(a)
if n > len(b) {
n = len(b)
}
if a.ptr != b.ptr {
memmove(a.ptr, b.ptr, n*sizeof(elem(a)))
}
例子
代码语言:javascript复制 arr := [10]int{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
var sl []int = arr[1:4]
var s2 []int = arr[7:]
fmt.Println(len(sl),cap(sl)) // 3,9
fmt.Println(len(s2),cap(s2)) // 3,3
一个切片的容量可以被看作是透过这个窗口最多可以看到的底层数组中元素的个数。注意,切片代表的窗口是无法向左扩展的。(前面提到的)
使用技巧
代码语言:javascript复制a = a[:len(a)-1] // 删除尾部1个元素
a = a[:len(a)-N] // 删除尾部N个元素
a = a[1:] // 删除开头1个元素
a = a[N:] // 删除开头N个元素
a = append(a[:i], a[j:]...) // cut i ~ j
假设切片里存放的是指针对象,那么下面删除末尾的元素后,被删除的元素依然被切片底层数组引用,从而导致被自动垃圾回收器回收(这要依赖回收器的实现方式):
保险的方式是先将需要自动内存回收的元素设置为nil
,保证自动回收器可以发现需要回收的对象,然后再进行切片的删除操作:
var a []*int{ ... }
a[len(a)-1] = nil // GC回收最后一个元素内存
a = a[:len(a)-1] // 从切片删除最后一个元素
同理
截掉切片[i,j)之间的元素:
代码语言:javascript复制a = append(a[:i], a[j:]...)
上面的Cut如果元素是指针的话,会存在内存泄露,所以我们要对删除的元素设置nil,等待GC。
代码语言:javascript复制copy(a[i:], a[j:])
for k, n := len(a)-j i, len(a); k < n; k {
a[k] = nil // or the zero value of T
}
a = a[:len(a)-j i]
Delete(GC)
代码语言:javascript复制copy(a[i:], a[i 1:])
a[len(a)-1] = nil // or the zero value of T
a = a[:len(a)-1]
切片使用不当对内存的泄露
- 应该将原切片拷到一个新的切片操作,比如使用切片的前5个slice
func getMessageType(msg []byte) []byte {
msgType := make([]byte, 5)
copy(msgType, msg)
return msgType
}
分组切片
代码语言:javascript复制func chunk(actions []int, batchSize int) [][]int {
var batches [][]int
for batchSize < len(actions) {
actions, batches = actions[batchSize:], append(batches, actions[0:batchSize:batchSize])
}
batches = append(batches, actions)
return batches
}
同时数组可以作为 map 的 k(键),而切片不行
- 它的大小和类型在编译时就已经确定了。
- append函数的常见操作
- 删除位于索引 i 的元素:a = append(a:i, ai 1:...)
- 切除切片 a 中从索引 i 至 j 位置的元素:a = append(a:i, aj:...)
- 为切片 a 扩展 j 个元素长度:a = append(a, make([]T, j)...)
- 索引 i 的位置插入切片 b 的所有元素:a = append(a:i, append(b, ai:...)...)
并发安全
slice 是非协程安全的数据类型,如果创建多个 goroutine 对 slice 进行并发读写,会造成丢失。看一段代码
代码语言:javascript复制package main
import (
"fmt"
"sync"
)
func main () {
a := make([]int, 0)
var wg sync.WaitGroup
for i := 0; i < 10000; i {
wg.Add(1)
go func(i int) {
a = append(a, i)
wg.Done()
}(i)
}
wg.Wait()
fmt.Println(len(a))
}
// 9403 9876 9985 9491 ...
多次执行,每次得到的结果都不一样,总之一定不会是想要的 10000 个。想要解决这个问题,按照协程安全的编程思想来考虑问题
可以考虑使用 channel 本身的特性(阻塞)来实现安全的并发读写。
代码语言:javascript复制func main() {
a := make([]int, 0)
buffer := make(chan int)
go func() {
for v := range buffer {
a = append(a, v)
}
}()
var wg sync.WaitGroup
for i := 0; i < 10000; i {
wg.Add(1)
go func(i int) {
buffer <- i
wg.Done()
}(i)
}
wg.Wait()
fmt.Println(len(a))
}
// 10000
slice 坑
bar 执行了 append 函数之后,最终也修改了 foo 的最后一个元素,这是一个在实践中非常常见的陷阱。
代码语言:javascript复制foo := []int{0, 0, 0, 42, 100}
bar := foo[1:4]
bar = append(bar, 99)
fmt.Println("foo:", foo) // foo: [0 0 0 42 99]
fmt.Println("bar:", bar) // bar: [0 0 42 99]
bar 的 cap 容量会到原始切片的末尾,所以当前 bar 的 cap 长度为 4。
如果要解决这样的问题,其实可以在截取时指定容量:
代码语言:javascript复制foo := []int{0,0,0,42,100}
bar := foo[1:4:4]
bar = append(bar, 99)
fmt.Println("foo:", foo) // foo: [0 0 0 42 100]
fmt.Println("bar:", bar) // bar: [0 0 42 99]
foo1:4:4 这里,第三个参数 4 代表 cap 的位置一直到下标 4,但是不包括下标 4。 所以当前 bar 的 Cap 变为了 3,和它的长度相同。当 bar 进行 append 操作时,将发生扩容,它会指向与 foo 不同的底层数据空间。
切片中的三种特殊状态
切片的三种特殊状态 —— 「零切片」、「空切片」和「nil 切片」。
空切片和 nil 切片的区别在于,空切片指向的地址不是nil,指向的是一个内存地址,但是它没有分配任何内存空间,即底层元素包含0个元素。
不管是使用 nil 切片还是空切片,对其调用内置函数 append,len 和 cap 的效果都是一样的。
通过 unsafe.Pointer 来转换 Go 语言的任意变量类型。
代码语言:javascript复制var s1 []int
var s2 = []int{}
var s3 = make([]int, 0)
var s4 = *new([]int)
var a1 = *(*[3]int)(unsafe.Pointer(&s1))
var a2 = *(*[3]int)(unsafe.Pointer(&s2))
var a3 = *(*[3]int)(unsafe.Pointer(&s3))
var a4 = *(*[3]int)(unsafe.Pointer(&s4))
fmt.Println(a1)
fmt.Println(a2)
fmt.Println(a3)
fmt.Println(a4)
---------------------
[0 0 0]
[824634355296 0 0]
[824634355296 0 0]
[0 0 0]
其中输出为 0 0 0 的 s1 和 s4 变量就是「 nil 切片」,s2 和 s3 变量就是「空切片」。824634199592 这个值是一个特殊的内存地址,所有类型的「空切片」都共享这一个内存地址。
空切片指向的 zerobase 内存地址是一个神奇的地址
「 nil 切片」和 「空切片」在使用上有什么区别么?
最好办法是不要创建「 空切片」,统一使用「 nil 切片」,同时要避免将切片和 nil 进行比较来执行某些逻辑。这是官方的标准建议。(正确选择 var res []int )
代码语言:javascript复制package main
import "fmt"
func main() {
var s1 []int // nil 切片
var s2 = []int{} // 空切片
fmt.Println(s1 == nil)
fmt.Println(s2 == nil)
fmt.Printf("%#vn", s1)
fmt.Printf("%#vn", s2)
}
-------
true
false
[]int(nil)
[]int{}
「空切片」和「 nil 切片」有时候会隐藏在结构体中,这时候它们的区别就被太多的人忽略了,看个例子
代码语言:javascript复制type Something struct {
values []int
}
var s1 = Something{}
var s2 = Something{[]int{}}
fmt.Println(s1.values == nil)
fmt.Println(s2.values == nil)
--------
true
false
「空切片」和「 nil 切片」还有一个极为不同的地方在于 JSON 序列化
代码语言:javascript复制type Something struct {
Values []int
}
var s1 = Something{}
var s2 = Something{[]int{}}
bs1, _ := json.Marshal(s1)
bs2, _ := json.Marshal(s2)
fmt.Println(string(bs1))
fmt.Println(string(bs2))
---------
{"Values":null}
{"Values":[]}
注意,对于切片的判断最好使用len()==0
参考
- why-go-vet-report-uint0-might-be-too-small-for-shift-of-63
- slice类型存什么?make和new?slice和数组?扩容规则?
- 切片(slice)性能及陷阱
- 切片的容量是怎样增长的
- 3.2 切片
- 深度解析 Go 语言中「切片」的三种特殊状态
我正在参与2023腾讯技术创作特训营第三期有奖征文,组队打卡瓜分大奖!