Go语言defer语句的三种机制整理

脚本专栏 2024/12/28 佚名

3 2 1

Golang 的 1.13 版本与 1.14 版本对 defer 进行了两次优化，使得 defer 的性能开销在大部分场景下都得到大幅降低，其中到底经历了什么原理？

这是因为这两个版本对 defer 各加入了一项新的机制，使得 defer 语句在编译时，编译器会根据不同版本与情况，对每个 defer 选择不同的机制，以更轻量的方式运行调用。

堆上分配

在 Golang 1.13 之前的版本中，所有 defer 都是在堆上分配，该机制在编译时会进行两个步骤：

在 defer 语句的位置插入 runtime.deferproc，当被执行时，延迟调用会被保存为一个 _defer 记录，并将被延迟调用的入口地址及其参数复制保存，存入 Goroutine 的调用链表中。
在函数返回之前的位置插入 runtime.deferreturn，当被执行时，会将延迟调用从 Goroutine 链表中取出并执行，多个延迟调用则以 jmpdefer 尾递归调用方式连续执行。

这种机制的主要性能问题存在于每个 defer 语句产生记录时的内存分配，以及记录参数和完成调用时参数移动的系统调用开销。

栈上分配

Go 1.13 版本新加入 deferprocStack 实现了在栈上分配的形式来取代 deferproc，相比后者，栈上分配在函数返回后 _defer 便得到释放，省去了内存分配时产生的性能开销，只需适当维护 _defer 的链表即可。

编译器有自己的逻辑去选择使用 deferproc 还是 deferprocStack，大部分情况下都会使用后者，性能会提升约 30%。不过在 defer 语句出现在了循环语句里，或者无法执行更高阶的编译器优化时，亦或者同一个函数中使用了过多的 defer 时，依然会使用 deferproc。

开放编码

Go 1.14 版本继续加入了开发编码（open coded），该机制会将延迟调用直接插入函数返回之前，省去了运行时的 deferproc 或 deferprocStack 操作，在运行时的 deferreturn 也不会进行尾递归调用，而是直接在一个循环中遍历所有延迟函数执行。

这种机制使得 defer 的开销几乎可以忽略，唯一的运行时成本就是存储参与延迟调用的相关信息，不过使用此机制需要一些条件：

没有禁用编译器优化，即没有设置 -gcflags "-N"；
函数内 defer 的数量不超过 8 个，且返回语句与延迟语句个数的乘积不超过 15；
defer 不是在循环语句中。

该机制还引入了一种元素 —— 延迟比特（defer bit），用于运行时记录每个 defer 是否被执行（尤其是在条件判断分支中的 defer），从而便于判断最后的延迟调用该执行哪些函数。

延迟比特的原理：

同一个函数内每出现一个 defer 都会为其分配 1 个比特，如果被执行到则设为 1，否则设为 0，当到达函数返回之前需要判断延迟调用时，则用掩码判断每个位置的比特，若为 1 则调用延迟函数，否则跳过。

为了轻量，官方将延迟比特限制为 1 个字节，即 8 个比特，这就是为什么不能超过 8 个 defer 的原因，若超过依然会选择堆栈分配，但显然大部分情况不会超过 8 个。

用代码演示如下：

deferBits = 0 // 延迟比特初始值 00000000

deferBits |= 1<<0 // 执行第一个 defer，设置为 00000001
_f1 = f1 // 延迟函数
_a1 = a1 // 延迟函数的参数
if cond {
  // 如果第二个 defer 被执行，则设置为 00000011，否则依然为 00000001
  deferBits |= 1<<1
  _f2 = f2
  _a2 = a2
}
...
exit:
// 函数返回之前，倒序检查延迟比特，通过掩码逐位进行与运算，来判断是否调用函数

// 假如 deferBits 为 00000011，则 00000011 & 00000010 != 0，因此调用 f2
// 否则 00000001 & 00000010 == 0，不调用 f2
if deferBits & 1<<1 != 0 {
  deferBits &^= 1<<1 // 移位为下次判断准备
  _f2(_a2)
}
// 同理，由于 00000001 & 00000001 != 0，调用 f1
if deferBits && 1<<0 != 0 {
  deferBits &^= 1<<0
  _f1(_a1)
}

总结

以往 Golang defer 语句的性能问题一直饱受诟病，最近正式发布的 1.14 版本终于为这个争议画上了阶段性的句号。如果不是在特殊情况下，我们不需要再计较 defer 的性能开销。

参考资料

[1] Ou Changkun - Go 语言原本

[2] 峰云就她了 - go1.14实现defer性能大幅度提升原理

[3] 34481-opencoded-defers

Go语言,defer语句

标签：

Go语言,defer语句

免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

无争山庄资源网 Copyright www.whwtcm.com

评论“Go语言defer语句的三种机制整理”

Go语言defer语句的三种机制整理

暂无“Go语言defer语句的三种机制整理”评论...

www.whwtcm.com 无争山庄资源网

129,905影音资源

244,626技术资源

111,817软件资源

578,645站长资源

最新文章

转载一个别人收藏的精典网站Ruby,HIBERNATE

2024/12/28

可与Spreadsheets媲美的在线表格系统:EditG

2024/12/28

cygwin使用心得

2024/12/28

脚本的DVD开发

2024/12/28

局域网设置自动配置脚本文件的写法与用途

2024/12/28

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2024/12/28

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

Go语言defer语句的三种机制整理

Go语言,defer语句

Go中strings的常用方法详解

使用go module导入本地包的方法教程详解

评论“Go语言defer语句的三种机制整理”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

Go语言defer语句的三种机制整理

Go语言,defer语句

Go中strings的常用方法详解

使用go module导入本地包的方法教程详解

评论“Go语言defer语句的三种机制整理”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存