美文网首页
python 浅拷贝 深拷贝 Dataframe

python 浅拷贝 深拷贝 Dataframe

作者: xiao_dong_zi | 来源:发表于2020-06-07 23:31 被阅读0次

一、前言

   写程序写的多了,会经常发现很多写法的随意和不正规。比如,a=[1,2] ;b=a;
随后对a的操作是否会给b造成同样的影响呢?(反过来也一样)。说的官方点的话,就是我们用b=a 这样赋值,到底是在引用还是在复制

二、理论部分

2.1、赋值、引用

在python中赋值语句总是建立对象的引用值,而不是复制对象。因此,python变量更像是指针,而不是数据存储区域。

  • 2.1.1 先用个例子,来看
a=[1,2,3]
b=a
a[0]=2
print(a)
print(b)

两个输出的结果都是[2,2,3]
就是说在简单b=a 操作之后,一个对象中赋值的操作也会对另一个引起影响。这其实是引用而不是复制。

  • 2.2 可变对象&不可变对象
    在Python中,对象分为两种:可变对象和不可变对象,不可变对象包括int,float,long,str,tuple等,可变对象包括list,set,dict等。需要注意的是:这里说的不可变指的是值的不可变。对于不可变类型的变量,如果要更改变量,则会创建一个新值,把变量绑定到新值上,而旧值如果没有被引用就等待垃圾回收。另外,不可变的类型可以计算hash值,作为字典的key。可变类型数据对对象操作的时候,不需要再在其他地方申请内存,只需要在此对象后面连续申请(+/-)即可,也就是它的内存地址会保持不变,但区域会变长或者变短。
    说成人话,就是在python里面实打实的数才会占地方(内存),比较高级点的对象都是在引用这些地方的位置(指针)

举个简单例子


举个例子.png

举个函数的例子


函数例子.png

对于上面的输出,不少Python初学者都比较疑惑:第一个例子看起来像是传值,而第二个例子确实传引用。其实,解释这个问题也非常容易,主要是因为可变对象和不可变对象的原因:对于可变对象,对象的操作不会重建对象,而对于不可变对象,每一次操作就重建新的对象。

三、重要应用

3.1、深拷贝deepcopy与浅拷贝copy(python)

python中的对象之间赋值时是按引用传送的,如果需要拷贝对象,需要使用标准库中的copy模块

1、copy.copy 浅拷贝,只拷贝父对象,不会拷贝对象的内部的子对象。(子对象(数组)修改,也会修改)

2、copy.deepcopy 深拷贝,拷贝对象及其子对象(原始对象)


import copy
a=[1,2,[3,4],{'a':1}]   # 原始对象
b=a     # 赋值,传对象的引用
c=copy.copy(a)  # 对象拷贝,浅拷贝
d=copy.deepcopy(a)  # 对象拷贝,深拷贝
e=a[:]  # 能复制序列,浅拷贝
 
a.append('add1')  # 修改对象a
a[2].append('add2')  # 修改对象a中的[3,4]数组对象
a[3]='666'
print('a:',a)
print('b:',b)
print('c:',c)
print('d:',d)

结果.png

3.2、深拷贝deepcopy与浅拷贝copy(dataframe)

DataFrame.copy(deep=True)

复制此对象的索引和数据。

当deep=True(默认)时,将使用调用对象的数据和索引的副本创建新对象。对副本的数据或索引的修改不会反映在原始对象中(请参阅下面的注释)。

当deep=False,将创建一个新对象而不复制调用对象的数据或索引(仅复制对数据和索引的引用)。对原始数据的任何更改都将反映在浅层副本中(反之亦然)。

类型 备注
参数 deep ,bool,默认为True 创建深层副本,包括数据和索引的副本。随着deep=False无论是指数还是数据复制。
返回 Series,DataFrame 对象类型与调用者匹配。
>>> s = pd.Series([1, 2], index=["a", "b"])
>>> s
a    1
b    2
dtype: int64
>>> s_copy = s.copy()
>>> s_copy
a    1
b    2
dtype: int64

参考文献

1、python 部分
2、Dataframe 拷贝

相关文章

网友评论

      本文标题:python 浅拷贝 深拷贝 Dataframe

      本文链接:https://www.haomeiwen.com/subject/rcxktktx.html