学习 Python 一年,这次终于弄懂了浅拷贝和深拷贝
官方文档:copy主题
源代码: Lib/copy.py
话说,网上已经有很多关于 Python 浅拷贝和深拷贝的文章了,不过好多文章看起来还是决定似懂非懂,所以决定用自己的理解来写出这样一篇文章。
当别人一提起 Python 中的复制操作,你会不会立马站起来说:“我会”,于是就有了如下操作:
那浅拷贝和深拷贝有什么区别呢,你能给我讲讲吗?
从引用 vs.拷贝说起
首先,我们要弄清楚什么是对象引用与对象拷贝(复制)。
对象引用
Python 中对象的赋值其实就是对象的引用。当创建一个对象,把它赋值给另一个变量的时候,Python 并没有拷贝这个对象,只是拷贝了这个对象的引用而已。
如果这个过程不理解,可以看看下图:
当我们对 x 列表进行操作时,会发现 y 中也发生了意料之外的事情:
由于列表是可变的,修改 x 这个列表对象的时候,也会改变对象 y 中对 x 的引用。
所以当我们在原处修改可变对象时 可能会影响程序中其他地方对相同对象的其他引用,这一点很重要。如果你不想这样做,就需要明确地告诉 Python 复制该对象。
对象拷贝
如果你需要拷贝,可以进行如下操作:
没有限制条件的分片表达式(
L[:]
)工厂函数(如 list/dir/set)
字典 copy 方法(
X.copy()
)copy 标准库模块(
import copy
)
举个例子,假设有一个列表 L 和一个字典 D:
这样定义之后,当你修改 A 和 B 时,会发现并不会对原来的 L 跟 D 产生影响,因为,这就是对象的拷贝。
上述对列表和字典的拷贝操作默认都为浅拷贝:
制作字典的浅层复制可以使用
dict.copy()
方法而制作列表的浅层复制可以通过赋值整个列表的切片完成,例如,
copied_list = original_list[:]
。
说到这里,疑问就产生了?什么是浅拷贝?浅拷贝的对应深拷贝又该作何解释?
谈谈浅拷贝和深拷贝
官方文档定义:
浅层复制和深层复制之间的区别仅与复合对象 (即包含其他对象的对象,如列表或类的实例) 相关:
一个 浅层复制 会构造一个新的复合对象,然后(在可能的范围内)将原对象中找到的 引用 插入其中。
一个 深层复制 会构造一个新的复合对象,然后递归地将原始对象中所找到的对象的 副本 插入。
浅拷贝
浅拷贝:拷贝了最外围的对象本身,内部的元素都只是拷贝了一个引用而已。也就是,把对象复制一遍,但是该对象中引用的其他对象我不复制。
用通俗的话理解就是:你的橱柜(对象)里装着一🧺(篮子)🥚(鸡蛋),然后浅拷贝一下的意思。我只拷贝了最外面的这个橱柜,至于里面的内部元素(🧺和🥚)我并不拷贝。
当我们遇到简单的对象时,用上面的解释好像很好理解;如果遇到复合对象,就比如下列代码:
代码解释:
l2
是l1
的浅拷贝把 100 追加到
l1
,对l2
没有影响
l1
内部列表l1[1
中的 55 删除,对l2
也产生影响,因为l1[1]
和l2[1]
绑定的是同一个列表对可变对象来说,
l2[1
引用的列表进行+=就地修改列表。这次修改导致l1[1]
也发生了改变对元组来说,+= 运算符创建一个新元组,然后重新绑定给变量 l2[2]。这等同于
l2[2] = l2[2] + (10, 11)
。现在,l1
和l2
中最 后位置上的元组不是同一个对象
把这段代码可视化出来如下:
动手试一试,可以点此处
深拷贝
深拷贝:外围和内部元素都进行了拷贝对象本身,而不是引用。也就是,把对象复制一遍,并且该对象中引用的其他对象我也复制。
对比上面的篮子和鸡蛋:你的橱柜(对象)里装着一🧺(篮子)🥚(鸡蛋),然后深拷贝一下的意思。把最外面的这个橱柜和里面的内部元素(🧺和🥚)全部拷贝过来。
输出结果:
拷贝的特点
不可变类型的对象(如数字、字符串、和其他'原子'类型的对象)对于深浅拷贝毫无影响,最终的地址值和值都是相等的。也就是,"obj is copy.copy(obj)" 、"obj is copy.deepcopy(obj)"
可变类型的对象=浅拷贝: 值相等,地址相等 copy 浅拷贝:值相等,地址不相等 deepcopy 深拷贝:值相等,地址不相等
循环引用的对象如果对象有循环引用,那么这个朴素的算法会进入无限循环。deepcopy 函数会记住已经复制的对象,因此能优雅地处理循环引用。
循环引用:b 引用 a,然后追加到 a 中;deepcopy 会想办法复制 a,而 copy 会进入无限循环。如下面代码:
输出结果:
深浅拷贝的作用
1,减少内存的使用 2,以后在做数据的清洗、修改或者入库的时候,对原数据进行复制一份,以防数据修改之后,找不到原数据。3. 可以定制复制行为,通过实现__copy()
和__deep__()
方法来控制。
总结
看完这篇文章后,转身就跟你同桌说:“x 同学,听说你最近在学 Python,你知道浅拷贝和深拷贝吗?”“不知道,学得有点晕”“没事,我来给你讲讲:”
拷贝其实在开始学好几个操作语句中,我们就已经使用过却可能不知道的(前 3 个),而且浅拷贝是 Python 的默认拷贝方式。拷贝的方法如下:
可变类型的切片操作:
[:]
工厂函数(如 list/dir/set)
字典 copy 方法(
X.copy()
)然后就是 Python 有专门的 copy 标准库模块:包含两个方法
copy()
和deepcopy()
浅拷贝就像是我只拷贝最外围的对象,对象中引用的其他对象我不复制。深拷贝就是完整的把对象和对象里的内容都拷贝过来。拷贝的目的:
为了节省内存
防止数据丢失。
后记:深浅拷贝的坑及难以理解的点也只在复合对象上,简单对象就是我们平常理解的复制。而针对非容器类型(如数字、字符串、和其他'原子'类型的对象)没有被拷贝一说。
要是你的同桌还是不懂,你就把这篇文章甩给他,让他好好看看。如果你觉得这篇文章还不错,请点个赞或者收个藏,点个关注更好啦。
本文内容有参考:
中文网址:将你的代码运行可视化
《流畅的 Python》-- 第 8 章 对象引用、可变性和垃圾回收
《Python3 标准库》-- 2.9 copy — Duplicate Objects
版权声明: 本文为 InfoQ 作者【宇宙之一粟】的原创文章。
原文链接:【http://xie.infoq.cn/article/30be0e685a82996625382ef08】。文章转载请联系作者。
评论