写点什么

面试官:请说一下如何优化结构体的性能?

作者:王中阳Go
  • 2023-03-07
    北京
  • 本文字数:1851 字

    阅读完需:约 6 分钟

面试官:请说一下如何优化结构体的性能?

使用内存对齐机制优化结构体性能,妙啊!

前言

之前分享过 2 篇结构体文章:10秒改struct性能直接提升15%,产品姐姐都夸我好棒Go语言空结构体这3种妙用,你知道吗? 得到了大家的好评。


这篇继续分享进阶内容:


结构体的定义,大家都很熟悉,想要定义出更节省内存空间的结构体,可不是一件简单的事。


我们必须掌握 Go 的结构体内存对齐机制,才能做出相应的优化:节省内存并提高性能。

先来看个例子

下面定义两个结构体,字段都一样,只是部分字段稍微调整了一下顺序。


但输出的结果却完全不同:一个顺序调整就节省了 8 个字节,太神奇了。


type BadSt struct {  A int32  B int64  C bool}
type GoodSt struct { A int32 C bool B int64}
func main() { bad := BadSt{A: 10, B: 20, C: false} fmt.Println(unsafe.Sizeof(bad))//输出结果:24 good := GoodSt{A: 10, B: 20, C: false} fmt.Println(unsafe.Sizeof(good))//输出结果:16}
复制代码


为什么 bad 占用 24 字节,而 good 却只占用 16 字节呢


想要解开这个问题,我们得先来学习一下内存对齐机制,然后再来进一步分析。

原理讲解

基本概念

为了能让 CPU 可以更快的存储、读取到各个字段,Go 编译器会帮我们把结构体做数据的对齐。


所谓的数据对齐,是指内存地址的大小是所存储数据大小的整数倍(按字节为单位),以便 CPU 可以一次将该数据从内存中读取出来,减少了读取次数。


编译器通过在结构体的各个字段之间填充一些空白,来达到对齐的目的

CPU 访问内存

CPU 访问内存时,并不是逐个字节访问,而是以机器字(word)为单位进行访问


比如 64 位 CPU 的字长(word size)为 8bytes,那么 CPU 访问内存的单位也是 8 字节,每次加载的内存数据也是固定的若干字长,如 8words(64bytes)、16words(128bytes)等

对齐系数

不同硬件平台占用的大小和对齐值都可能是不一样的,每个特定平台上的编译器都有自己的默认"对齐系数",32 位系统对齐系数是 4,64 位系统对齐系数是 8


不同类型的对齐系数也可能不一样,使用Go语言中的unsafe.Alignof函数可以返回相应类型的对齐系数,对齐系数都符合2^n这个规律,最大也不会超过 8


func main() {  fmt.Printf("bool:   %d\n", unsafe.Alignof(bool(true)))  fmt.Printf("string: %d\n", unsafe.Alignof(string("a")))  fmt.Printf("int:    %d\n", unsafe.Alignof(int(0)))  fmt.Printf("int32:  %d\n", unsafe.Alignof(int32(0)))  fmt.Printf("int64:  %d\n", unsafe.Alignof(int64(0)))  fmt.Printf("float64:  %d\n", unsafe.Alignof(float64(0)))  fmt.Printf("float32:%d\n", unsafe.Alignof(float32(0)))}//输出结果://bool:   1//string: 8//int:    8//int32:  4//int64:  8//float64:8//float32:4
复制代码

对齐原则

  1. 结构体变量中成员的偏移量必须是成员大小的整数倍

  2. 整个结构体的内存大小必须是最大字节的整数倍(结构体的内存占用是 1/4/8/16byte…)

案例分析

type BadSt struct {  A int32  B int64  C bool}
复制代码

BadSt 结构体,占用 24 个字节


分析过程:


  1. 字段 A 4 字节:先计算偏移量,最开头下标为 0,0%4=0,正好整除,先占用 4 个字节;

  2. 字段 B 8 字节:下标 4-7,对 8 都不能整除,则填充空白,下标 8 可以整除,所以下标 8-15 8 个字节为字段 B 的存储使用;

  3. 字段 C 1 字节:下标 16,对 1 可以整除,所以下标 16 则用作字段 C 的存储;

  4. 最后,该结构体字段最大字节为 8 且目前已占用 17 字节,要保证是整数倍,所以最后面需要填充 7 个字节,占满 24 字节,才能满足条件(对齐原则 2)。



GoodSt 结构体,占用 16 个字节


type GoodSt struct {  A int32  C bool  B int64}
复制代码


分析过程:


  1. 字段 A 4 字节:先计算偏移量,最开头下标为 0,0%4=0,正好整除,先占用 4 个字节;

  2. 字段 C 1 字节:下标 4,对 1 可以整除,所以下标 4 则用作字段 C 的存储;

  3. 字段 B 8 字节:下标 5-7,对 8 都不能整除,则填充空白,下标 8 可以整除,所以下标 8-15 8 个字节为字段 B 的存储使用;

  4. 最后,该结构体字段最大字节为 8 且目前已占用 16 字节,正好是整数倍,所以后面不再需要填充空白了。

总结

通过上文的原理讲解和案例分析,我们发现内存对齐机制并不复杂。


可以简单理解为:将对齐系数小的字段,尽可能放在一起,尽量减少空白填充。


掌握了内存对齐机制后,结构体 Struct 的优化,调整下字段顺序,效果立竿见影。内存对齐其实就是典型的空间换时间的方式,来达到优化的目的。牢记对齐原则,对实际场景进行分析,减少空白填充


一起学习

我的文章首发在我的公众号: 程序员升职加薪之旅,欢迎大家关注,第一时间阅读我的文章。


也欢迎大家关注我,点赞、留言、转发。你的支持,是我更文的最大动力!

发布于: 2023-03-07阅读数: 29
用户头像

王中阳Go

关注

靠敲代码在北京买房的程序员 2022-10-09 加入

【微信】wangzhongyang1993【公众号】程序员升职加薪之旅【成就】InfoQ专家博主👍掘金签约作者👍B站&掘金&CSDN&思否等全平台账号:王中阳Go

评论 (1 条评论)

发布
用户头像
使用内存对齐机制优化结构体性能,妙啊!通过上文的原理讲解和案例分析,我们发现内存对齐机制并不复杂。可以简单理解为:将对齐系数小的字段,尽可能放在一起,尽量减少空白填充。掌握了内存对齐机制后,结构体Struct的优化,调整下字段顺序,效果立竿见影。
2023-03-07 10:21 · 北京
回复
没有更多了
面试官:请说一下如何优化结构体的性能?_Go_王中阳Go_InfoQ写作社区