Go 语言,垃圾回收、三色标记原理,终于能跟面试官扯皮了!
垃圾回收(Garbage Collection,简称 GC)是编程语言中自动的内存管理机制,垃圾回收,垃圾指的是不再需要的内存块,如果不及时清理就没有办法再利用。
垃圾回收算法
常见的垃圾回收算法有:
引用计数:每个对象维护一个引用计数,如果这个对象被销毁,则计数 -1 ,当计数为 0 时,回收该对象。
优点:对象可以很快被回收,不会出现内存耗尽或到达阀值才回收。
缺点:不能很好的处理循环引用
标记-清除:从根变量开始遍历所有引用的对象,引用的对象标记“被引用”,没有被标记的则进行回收。
优点:解决了引用计数的缺点。
缺点:需要 STW(stop the world),暂时停止程序运行。
分代收集:按照对象生命周期长短划分不同的代空间,生命周期长的放入老年代,短的放入新生代,不同代有不同的回收算法和回收频率。
优点:回收性能好
缺点:算法复杂
Go 语言的 GC(垃圾回收)
标记-清除(mark and sweep)
此算法是在 Go V1.3 之前使用的,主要有两个主要的步骤:
标记(Mark phase)——》清除(Sweep phase)
暂停程序业务逻辑, 找出不可达的对象,然后做上标记。
注意:mark and sweep 算法在执行的时候,需要程序暂停!也就是所谓的 STW(stop the world)。这段时间程序会卡住。
程序可达对象为 1、2、4
开始标记,找出所有可达的对象,并标记
对象 1、2、4 做上标记
清除未被标记的对象
程序暂停取消。然后重复上面的过程,直至程序生命周期结束。
三色并发标记法
此算法是在 Go V1.5 开始使用的,三色只是为了叙述上方便抽象出来的一种说法,实际上对象并没有颜色之分。这里的三色,对应了垃圾回收过程中对象的三种状态:
灰色:对象还在标记队列中等待
黑色:对象已被标记,该对象不会在本次 GC 中被清理
白色:对象未被标记,该对象将会在本次 GC 中被清理
初始状态下所有对象都是白色的。
从根节点开始遍历所有对象,把遍历到的对象变成灰色对象(备注:这里变成灰色对象的都是根节点的对象)。
遍历灰色对象,将灰色对象引用的对象(备注:这里指的是灰色对象引用到的所有对象,包括灰色节点间接引用的那些对象)也变成灰色对象,然后将遍历过的灰色对象变成黑色对象。
循环步骤 3,直到灰色对象全部变黑色。
通过写屏障(write-barrier)检测对象有变化,重复以上操作(备注:因为 mark 和用户程序是并行的,所以在上一步执行的时候可能会有新的对象分配,写屏障是为了解决这个问题引入的)。
收集所有白色对象(垃圾)。
举例说明:
初识阶段,所以对象均为白色,调用情况为:
root ->A->B/A->C/A<->D;root->F;E;G->H;
GC 开始扫描,从根节点开始遍历,发现只有 A 和 F 是根节点,于是将 A、F 从变为灰色对象。
GC 继续扫描灰色对象,会将灰色对象的节点中引用的节点也变为灰色对象,A 节点引用的节点 B、C、D 会被变为灰色对象,接着 A 的所有子节点遍历完毕,便会变为黑色对象,而 F 节点没有子节点,也会变为黑色对象。
GC 会循环遍历灰色对象,直到灰色对象之中没有节点为止,在本例中,发现 B、C、D 都没有子节点是白色,便将 B、C、D 都变为黑色对象。
剩下 E、G、H 为白色对象,GC 便进行回收这些白色对象。
上面的垃圾回收结束之后,GC 会在进行一步操作,也就是将黑色对象重新变色成白色对象,供下一次垃圾回收使用。
Stop The World
Golang 中的 STW(Stop The World)是停掉所有的 goroutine,专心做垃圾回收,待垃圾回收结束后再恢复 goroutine。STW 时间的长短直接影响了应用的执行,时间过长对于一些 web 应用来说是不可接受的,这也是广受诟病的原因之一。为了缩短 STW 的时间,Golang 不断优化垃圾回收算法,这种情况得到了很大的改善。
垃圾回收优化
写屏障(Write Barrier)
STW 目的是防止 GC 扫描时内存变化而停掉 goroutine,而写屏障就是让 goroutine 与 GC 同时运行的手段。虽然写屏障不能完全消除 STW,但是可以大大减少 STW 的时间。写屏障类似一种开关,在 GC 的特定时机开启,开启后指针传递时会把指针标记,即本轮不回收,下次 GC 时再确定。GC 过程中新分配的内存会被立即标记,用的并不是写屏障技术,也即 GC 过程中分配的内存不会在本轮 GC 中回收。
辅助 GC(Mutator Assist)
为了防止内存分配过快,在 GC 执行过程中,如果 goroutine 需要分配内存,那么这个 goroutine 会参与一部分 GC 的工作,即帮助 GC 做一部分工作,这个机制叫作 Mutator Assist。
垃圾回收触发时机
每次内存分配时都会检查当前内存分配量是否已达到阀值,如果达到阀值则立即启动 GC。内存增长率由环境变量 GOGC 控制,默认为 100,即每当内存扩大一倍时启动 GC。
阀值 = 上次GC内存分配量 * 内存增长率
默认情况下,最长 2 分钟触发一次 GC。
程序代码中也可以使用 runtime.GC() 来手动触发 GC。这主要用于 GC 性能测试和统计。
评论