Go,一文搞懂 defer 实现原理
defer 语句用于延迟函数的调用,使用 defer 关键字修饰一个函数,会将这个函数压入栈中,当函数返回时,再把栈中函数取出执行。
老规矩,我们先来答几道题试试水。
答题环节
下面程序输出什么?
答
案
是:1
解析:延迟函数 fmt.Println(a) 的参数在 defer 语句出现的时候就已经确定下来了,所以不管后面如何修改 a 变量,都不会影响延迟函数。
下面程序输出什么?
答
案
是:
解析:延迟函数 printTest() 的参数在 defer 语句出现的时候就已经确定下来了,即为数组的地址,延迟函数执行的时机是在 return 语句之前,所以对数组的最终修改的值会被打印出来。
下面程序输出什么?
答
案
是:
解析:函数的 return 语句并不是原子级的,实际的执行过程为为设置返回值—>ret,defer 语句是在返回前执行,所以返回过程是:设置返回值—>执行 defer—>ret。所以 return 语句先把 result 设置成 i
的值(1),defer 语句中又把 result 递增 1 ,所以最终返回值为 2 。
defer 规则
延迟函数的参数在 defer 语句出现时就已经确定
注意:对于指针类型的参数,规则仍然适用,不过延迟函数的参数是一个地址值,这种情况下,defer 后面的语句对变量的修改可能会影响延迟函数。
延迟函数执行按 先进后出 顺序执行,即先出现的 defer 最后执行
延迟函数可能操作主函数的具名返回值
函数返回过程
上面题目中我们已经了解到,函数的 return 语句并不是原子级的,实际上 return 语句只代理汇编指令 ret。返回过程是:设置返回值—>执行 defer—>ret。
上面有 defer 例子的 return 语句实际执行过程是:
主函数拥有匿名返回值,返回字面值时
当主函数有一个匿名返回值,返回时使用字面值,例如返回 “1”,“2”,“3” 这样的值,此时 defer 语句是不能操作返回值的。
上面的 return 语句,直接把1
作为返回值,延迟函数无法操作返回值,所以也就不能修改返回值。
主函数拥有匿名返回值,返回变量时
当主函数有一个匿名返回值,返回会使用本地或者全局变量,此时 defer 语句可以引用到返回值,但不会改变返回值。
上面的函数,返回一个局部变量,defer 函数也有操作这个局部变量。对于匿名返回值来说,我们可以假定仍然有一个变量用来存储返回值,例如假定返回值变量为 ”aaa”,上面的返回语句可以拆分成以下过程:
由于 i 是整型,会将值拷贝给变量 aaa,所以 defer 语句中修改 i 的值,对函数返回值不造成影响。
主函数拥有具名返回值时
主函声明语句中带名字的返回值,会被初始化成一个局部变量,函数内部可以像使用局部变量一样使用该返回值。如果 defer 语句操作该返回值,可能会改变返回结果。
上面的返回语句可以拆分成以下过程:
defer 实现原理
源码包 src/src/runtime/runtime2.go:_defer 定义了 defer 的数据结构:
sp 函数栈指针
pc 程序计数器
fn 函数地址
link 指向自身结构的指针,用于链接多个 defer
defer 语句后面是要跟一个函数的,所以 defer 的数据结构跟一般的函数类似,不同之处是 defer 结构含有一个指针,用于指向另一个 defer ,每个 goroutine 数据结构中实际上也有一个 defer 指针指向一个 defer 的单链表,每次声明一个 defer 时就将 defer 插入单链表的表头,每次执行 defer 时就从单链表的表头取出一个 defer 执行。保证 defer 是按 FIFO 方式执行的。
defer 的创建和执行
源码包 src/runtime/panic.go 中定义了两个方法分别用于创建 defer 和执行 defer。
deferproc(): 在声明 defer 处调用,其将 defer 函数存入 goroutine 的链表中;
deferreturn():在 return 指令,准确的讲是在 ret 指令前调用,其将 defer 从 goroutine 链表中取出并执行。
归纳总结
defer 定义的延迟函数的参数在 defer 语句出时就已经确定下来了
defer 定义顺序与实际执行顺序相反
return 不是原子级操作的,执行过程是: 保存返回值—>执行 defer —>执行 ret
版权声明: 本文为 InfoQ 作者【微客鸟窝】的原创文章。
原文链接:【http://xie.infoq.cn/article/6f5cc8b14cc60c8985dc7257f】。文章转载请联系作者。
评论