天天看点

《Python面向对象编程指南》——2.7 __del__()方法

本节书摘来自异步社区《python面向对象编程指南》一书中的第2章,第2.7节,作者[美]steven f. lott, 张心韬 兰亮 译,更多章节内容可以访问云栖社区“异步社区”公众号查看。

<code>__del__()</code>方法有一个让人费解的使用场景。

这个方法的目的是在将一个对象从内存中清除之前,可以有机会做一些清理工作。如果使用上下文管理对象或者with语句来处理这种需求会更加清晰,这也是第5章“可调用对象和上下文的使用”的内容。对于python的垃圾回收机制而言,创建一个上下文比使用__del__()更加容易预判。

但是,如果一个python对象包含了一些操作系统的资源,__del__()方法是把资源从程序中释放的最后机会。例如,引用了一个打开的文件、安装好的设备或者子进程的对象,如果我们将资源释放作为__del__()方法的一部分实现,那么我们就可以保证这些资源最后会被释放。

很难预测什么时候__del__()方法会被调用。它并不总是在使用del语句删除对象时被调用,当一个对象因为命名空间被移除而被删除时,它也不一定被调用。python文档中用不稳定来描述__del__()方法的这种行为,并且提供了额外的关于异常处理的注释:运行期的异常会被忽略,相对地,会使用sys.stderr打印一个警告。

基于上面的这些原因,通常更倾向于使用上下文管理器,而不是实现__del__()。

cpython的实现中,对象会包括一个引用计数器。当对象被赋值给一个变量时,这个计数器会递增;当变量被删除时,这个计数器会递减。当引用计数器的值为0时,表示我们的程序不再需要这个对象并且可以销毁这个对象。对于简单对象,当执行删除对象的操作时会调用__del__()方法。

对于包含循环引用的复杂对象,引用计数器有可能永远也不会归零,这样就很难让__del__()被调用。

我们用下面的一个类来看看这个过程中到底发生了什么。

我们可以像下面这样创建和删除这个对象。

我们先创建,然后删除了noisy对象,几乎是立刻就看到了__del__()方法中输出的消息。这也就是说当变量x被删除后,引用计数器正确地归零了。一旦变量被删除,就没有任何地方引用noisy实例,所以它也可以被清除。

下面是浅复制中一种常见的情形。

python没有响应del语句。这说明这些noisy对象的引用计数器还没有归零,肯定还有其他地方引用了它们,下面的代码验证了这一点。

ln2变量是ln列表的一个浅复制。有两个列表引用了noisy对象,所以在这两个列表被删除并且引用计数器归零之前,python不会销毁这两个noisy对象。

还有很多种创建浅复制的方法。下面是其中的一些。

这里的关键是,由于浅复制在python中非常普遍,所以我们往往对存在的对象的引用感到非常困惑。

下面是一种常见的循环引用的情形。一个父类包含一个子类的集合,同时集合中的每个子类实例又包含父类的引用。

下面我们用这两个类来看看循环引用。

一个parent的instance包括一个children的列表。

每一个child的实例都有一个指向parent类的引用。当向parent内部的集合中插入新的child实例时,这个引用就会被创建。

我们故意把这两个类写得比较复杂,所以下面让我们看看当试图删除对象时,会发生什么。

parent和它的两个初始child实例都不能被删除,因为它们之间互相引用。

下面,我们创建一个没有child集合的parent实例。

和我们预期的一样,这个parent实例成功地被删除了。

由于互相之间有引用存在,因此我们不能从内存中删除parent实例和它包含的child实例的集合。如果我们导入垃圾回收器的接口——gc,我们就可以回收和显示这些不能被删除的对象。

下面的代码中,我们使用了gc.collect()方法回收所有定义了__del__()方法但是无法被删除的对象。

可以看到,我们的parent对象(例如,4313921808的id = 0x101213910)在不可删除的垃圾对象列表中很突出。为了让引用计数器归零,我们需要删除所有parent对象中的children列表,或者删除所有child实例中对parent的引用。

注意,即使把清理资源的代码放在__del__()方法中,我们也没办法解决循环引用的问题。因为__del__()方法是在循环引用被解除并且引用计数器已经归零之后被调用的。当有循环引用时,我们不能只是简单地依赖于python中计算引用数量的机制来清理内存中的无用对象。我们必须显式地解除循环引用或者使用可以保证垃圾回收的weakref引用。

如果我们需要循环引用,但是又希望将清理资源的代码写在__del__()中,这时候我们可以使用弱引用。循环引用的一个常见场景是互相引用:一个父类中包含了一个集合,集合中的每一个实例也包含了一个指向父类的引用。如果一个player对象中包含多个hand实例,那么在每一个hand对象中都包括一个指向对应的player类的引用可能会更方便。

默认的对象间的引用可以被称为强引用,但是,叫直接引用可能更好。python的引用计数机制会直接使用它们,而且如果引用计数无法删除这些对象的话,垃圾回收机器也能及时发现。它们是不可忽略的对象。

对一个对象的强引用就是直接引用,下面是一个例子。

当我们遇到如下语句。

<code>a= b()</code>

变量a直接引用了b类的一个对象。此时b的引用计数至少是1,因为a变量包含了一个指向它的引用。

想要找个一个弱引用相关的对象需要两个步骤。一个弱引用会调用x.parent(),这个函数将弱引用作为一个可调用对象来查找它真正的父对象。这个过程让引用计数器得以归零,垃圾回收器可以回收引用的对象,但是不回收这个弱引用。

weakref定义了一系列使用了弱引用而没有使用强引用的集合。它让我们可以创建一种特殊的字典类型,当这种字典的对象没有用时,可以保证被垃圾回收。

我们可以修改parent和child类,在child指向parent的引用中使用弱引用,这样就可以简单地保证无用对象会被销毁。

下面是修改后的类,它在child指向parent的引用中使用了弱引用。

我们将child中的parent引用改为一个weakref对象的引用。

在child类中,我们必须用上面说的两步操作来定位parent对象:

我们可以显式地确认引用的对象是否已经找到,因为有可能该引用已经变成虚引用。

当我们使用这个新的parent2类时,可以看到引用计数成功地归零同时对象也被删除了:

当一个weakref引用变成死引用时(因为引用被销毁了),我们有3个可能的方案。

重新创建引用对象,或重新从数据库中加载。

当垃圾回收器在低内存情况下错误地删除了一些对象时,使用warnings模块记录调试信息。

忽略这个问题。

通常,weakref引用变成死引用是因为响应的对象已经被删除了。例如,变量的作用域已经执行结束,一个没有用的命名空间,应用程序正在关闭。对于这个原因,通常我们会采取第3种响应方法。因为试图创建这个引用的对象时很可能马上就会被删除。

__del__()最常见的用途是确保文件被关闭。

通常,包含文件操作的类都会有类似下面这样的代码。

<code>__del__ = close</code>

这会保证__del__()方法同时也是close()方法。

其他更复杂的情况最好使用上下文管理器。详情请看第5章“可调用对象和上下文的使用”,我们会在第5章提供更多和上下文管理器有关的信息。