图解 Go 逃逸分析-技术圈

点击上方蓝色“Go语言中文网”关注，每天一起学 Go

本篇文章基于 Golang 1.13.

逃逸分析 是 Golang 编译器中的一个阶段，它通过分析用户源码，决定哪些变量应该在堆栈上分配，哪些变量应该逃逸到堆中。

本文是 Go语言中文网组织的 GCTT 翻译，发布在 Go语言中文网公众号，转载请联系我们授权。

静态分析

Go 静态地定义了在编译阶段应该被堆或栈分配的内容。当编译(go build)和/或运行(go run)你的代码时，可以通过标志 -gcflags="-m " 进行分析。下面是一个简单的例子。

package main

import "fmt"

func main() {
   num := GenerateRandomNum()
   fmt.Println(*num)
}

//go:noinline
func GenerateRandomNum() *int {
   tmp := rand.Intn(500)

   return &tmp
}

运行逃逸分析，具体命令如下：

F:\hello>go build -gcflags="-m" main.go
# command-line-arguments
.\main.go:15:18: inlining call to rand.Intn
.\main.go:10:13: inlining call to fmt.Println
.\main.go:15:2: moved to heap: tmp
.\main.go:10:14: *num escapes to heap
.\main.go:10:13: []interface {} literal does not escape
<autogenerated>:1: .this does not escape
<autogenerated>:1: .this does not escape

从上面的结果 .\main.go:15:2: moved to heap: tmp 中我们发现 tmp 逃逸到了堆中。

静态分析的第一步是生成源码的抽象语法树(具体命令：go build -gcflags="-m -m -m -m -m -W -W" main.go)，让 GoLang 了解在哪里进行了赋值和分配，以及变量的寻址和解引用。

下面是之前代码生成的 抽象语法树 的一个例子：

关于抽象语法树请参考：package ast^[1], ast example^[2]

为了简化分析，下面我给出了一个简化版的 抽象语法树 的结果：

由于该树暴露了定义的变量(用 NAME 表示)和对指针的操作(用 ADDR 或 DEREF 表示)，故它可以向 GoLang 提供进行 逃逸分析 所需要的所有信息。一旦建立了树，并解析了函数和参数，GoLang 现在就可以应用 逃逸分析 逻辑来查看哪些应该是堆或栈分配的。

超过堆栈框架的生命周期

在运行 逃逸分析 并从 AST 图中遍历函数(即: 标记)的同时，Go 会寻找那些超过当前栈框架并因此需要进行堆分配的变量。假设没有堆分配，在这个基础上，通过前面例子的栈框架来表示，我们先来定义一下 outlive 的含义。下面是调用这两个函数时，堆栈向下生长的情况。

在这种情况下，变量 num 不能指向之前堆上分配的变量。在这种情况下，Go 必须在 堆 上分配变量，确保它的生命周期超过堆栈框架的生命周期。

变量 tmp 现在包含了分配给堆栈的内存地址，可以安全地从一个堆栈框架复制到另一个堆栈框架。然而，并不是只有返回的值才会失效。下面是规则:

任何返回的值都会超过函数的生命周期，因为被调用的函数不知道这个值。
在循环外声明的变量在循环内的赋值后会失效。如下面的例子：

package main

func main() {
   var l *int
   for i := 0; i < 10; i++ {
      l = new(int)
      *l = i
   }
   println(*l)
}

./main.go:8:10: new(int) escapes to heap

在闭包外声明的变量在闭包内的赋值后失效。

package main

func main() {
   var l *int
   func() {
      l = new(int)
      *l = 1
   }()
   println(*l)
}

./main.go:10:3: new(int) escapes to heap

逃逸分析 的第二部分包括确定它是如何操作指针的，帮助了解哪些东西可能会留在堆栈上。

寻址和解引用

构建一个表示寻址/引用次数的加权图，可以让 Go 优化堆栈分配。让我们分析一个例子来了解它是如何工作的：

package main

func main() {
   n := getAnyNumber()
   println(*n)
}

//go:noinline
func getAnyNumber() *int {
   l := new(int)
   *l = 42

   m := &l
   n := &m
   o := **n

   return o
}

运行 逃逸分析 表明，分配逃逸到了堆。

./main.go:12:10: new(int) escapes to heap

下面是一个简化版的 AST 代码：

Go 通过建立加权图来定义分配。每一次解引用，在代码中用 * 表示，或者在节点中用 DEREF 表示，权重增加 1；每一次寻址操作，在代码中用 & 表示，或者在节点中用 ADDR 表示，权重减少 1。

下面是由 逃逸分析 定义的序列：

variable o has a weight of 0, o has an edge to n
variable n has a weight of 2, n has an edge to m
variable m has a weight of 1, m has an edge to l
variable l has a weight of 0, l has an edge to new(int)
variable new(int) has a weight of -1

每个变量最后的计数为负数，如果超过了当前的栈帧，就会逃逸到堆中。由于返回的值超过了其函数的堆栈框架，并通过其边缘得到了负数，所以分配逃到了堆上。

构建这个图可以让 Go 了解哪个变量应该留在栈上(尽管它超过了栈的时间)。下面是另一个基本的例子:

func main() {
   num := func1()
   println(*num)
}

//go:noinline
func func1() *int {
   n1 := func2()
   *n1++

   return n1
}

//go:noinline
func func2() *int {
   n2 := rand.Intn(99)

   return &n2
}
./main.go:20:2: moved to heap: n2

变量 n1 超过了堆栈框架，但它的权重不是负数，因为 func1 没有在任何地方引用它的地址。然而，n2 会超过栈帧并被取消引用，Go 可以安全地在堆上分配它。

via: https://medium.com/a-journey-with-go/go-introduction-to-the-escape-analysis-f7610174e890

作者：Vincent Blanchon^[3]译者：double12gzh^[4]校对：polaris1119^[5]

本文由 GCTT^[6] 原创编译，Go 中文网^[7] 荣誉推出，发布在 Go语言中文网公众号，转载请联系我们授权。

参考资料

[1]

package ast: https://golang.org/pkg/go/ast/#example_Print

[2]

ast example: https://golang.org/src/go/ast/example_test.go

[3]

Vincent Blanchon: https://medium.com/@blanchon.vincent

[4]

double12gzh: https://github.com/double12gzh

[5]

polaris1119: https://github.com/polaris1119

[6]

GCTT: https://github.com/studygolang/GCTT

[7]

Go 中文网: https://studygolang.com/

推荐阅读

通过实例理解Go逃逸分析

福利

我为大家整理了一份从入门到进阶的Go学习资料礼包，包含学习建议：入门看什么，进阶看什么。关注公众号「polarisxu」，回复 ebook 获取；还可以回复「进群」，和数万 Gopher 交流学习。