什么是 Python 垃圾回收机制中的引用计数
Python 中的 __del__
魔法方法,也被称为对象的终结者,是一个在对象即将被从内存中移除之前被调用的方法。它实际上并不做从内存中删除对象的工作,我们将在后面看到它是如何发生的。相反,这个方法是用来做任何在对象被移除前需要发生的清理工作。例如,关闭对象在创建时打开的任何文件。
在本节中,我们将使用下面这个类作为例子。
在上面的例子中,我们已经定义了我们的类在初始化时接受一个名字的输入,当调用 finaliser 时,它会通过打印相关实例的名字让我们知道。这样,我们就可以了解到哪些对象被从内存中删除,以及何时被删除。
那么,CPython 什么时候会决定从内存中删除一个对象呢?有两种方式(从 CPython 3.10 开始)会发生这种情况:引用计数和垃圾回收。
引用计数
如果我们在 Python 中有一个指向某个对象的指针,那就是对该对象的引用。对于一个给定的对象 a ,CPython 会跟踪有多少其他东西指向 a 。如果这个计数器达到零,就可以安全地从内存中删除这个对象,因为没有其他东西在使用它。让我们看一个例子。
在这里,我们创建了一个新的对象(MyNamedClass("Harward")),并创建了一个指向它的指针(Harward =)。然后,当我们删除 Harwade 时,我们删除了这个引用,MyNamedClass 实例现在的引用计数为 0。 所以,CPython 决定从内存中删除它--而且,就在这之前,它的 __del__
方法被调用,打印出了我们看到的上面的信息。
如果我们对一个对象创建了多个引用,我们将不得不摆脱所有的引用,以便使该对象被删除。
当然,我们的 MyNamedClass 实例本身可以包含指针--毕竟它们是任意的 Python 对象,我们可以给它们添加任何我们喜欢的属性。让我们看一个例子。
我们在上面的代码片断中所做的是设置了一些循环引用。名字为 Jane 的对象包含一个指向名字为 Bob 的对象的指针,反之亦然。当我们做下面的事情时,情况就变得有趣了。
我们现在已经删除了从命名空间到对象的指针。现在,我们完全不能访问那些 MyNameClass 对象了--但我们并没有收到告诉我们它们即将被删除的打印信息。这是因为这些对象仍有引用,包含在彼此之间,因此它们的引用计数不是 0 。
我们在这里创建的是一个循环隔离体;在这个结构中,每个对象在循环中至少有一个引用,使其保持活力,但循环中的所有对象都不能从命名空间中被访问。
循环隔离的直观表现
下面是我们创建一个循环隔离时的直观表现。
首先,我们创建两个对象,每个对象在命名空间中都有一个名字。
接下来,我们通过在每个对象上添加一个指针来连接我们的两个对象。
最后,我们通过删除两个对象的原始名称来从命名空间中删除指针。在这一点上,这两个对象从名字空间中是不可访问的,但每个对象都包含一个指向另一个对象的指针,所以它们的引用计数不是零。
所以,很明显,引用计数本身并不足以保持运行时的工作内存中没有无用的、不可回收的对象。这就是 CPython 的垃圾收集器发挥作用的地方。
版权声明: 本文为 InfoQ 作者【宇宙之一粟】的原创文章。
原文链接:【http://xie.infoq.cn/article/ad2eb9e74140fd18f511699dd】。文章转载请联系作者。
评论