每种编程语言都有各自的数据类型,其中面向对象的编程语言还允许开发者自定义数据类型(如:自定义类),Python也是一样。很多时候我们会有这样的需求:
把内存中的各种数据类型的数据通过网络传送给其它机器或客户端;
把内存中的各种数据类型的数据保存到本地磁盘持久化;
如果要将一个系统内的数据通过网络传输给其它系统或客户端,我们通常都需要先把这些数据转化为字符串或字节串,而且需要规定一种统一的数据格式才能让数据接收端正确解析并理解这些数据的含义。XML 是早期被广泛使用的数据交换格式,在早期的系统集成论文中经常可以看到它的身影;如今大家使用更多的数据交换格式是JSON(JavaScript Object Notation),它是一种轻量级的数据交换格式。JSON相对于XML而言,更加加单、易于阅读和编写,同时也易于机器解析和生成。除此之外,我们也可以自定义内部使用的数据交换格式。
将对象转换为可通过网络传输或可以存储到本地磁盘的数据格式(如:XML、JSON或特定格式的字节串)的过程称为序列化;反之,则称为反序列化。
相关模块:
json:用于实现python数据类型与通用字符串之间的转换(json),提供的方法:dumps()、loads()、dump、load()
例如:保存一个人的信息:
序列化:
import json
info={
'age':23,
'name':'buffon'
}
with open('a.txt','w') as f:
f.write(json.dumps(info))
dumps 是将python对象info转化成json字符串
反序列化:
import json
with open('a.txt','r') as f:
data=f.read()
data1=json.loads(data)
print(data1)
而dump和load功能与dumps和loads类似,可以直接操作文件句柄,以load为例:
import json
with open('a.txt','r') as f:
data1=json.load(f)
print(data1)
牵涉到的复杂数据的虚拟化,一般我们会用pickle模块,例如函数这种序列化使用json会报错
pickle模块实现了用于对Python对象结构进行 序列化 和 反序列化 的二进制协议,与json模块不同的是pickle模块序列化和反序列化的过程分别叫做 pickling 和 unpickling:
pickling: 是将Python对象转换为字节流的过程;
unpickling: 是将字节流二进制文件或字节对象转换回Python对象的过程;
- pickle模块与json模块对比
JSON是一种文本序列化格式(它输出的是unicode文件,大多数时候会被编码为utf-8),而pickle是一个二进制序列化格式;
JOSN是我们可以读懂的数据格式,而pickle是二进制格式,我们无法读懂;
JSON是与特定的编程语言或系统无关的,且它在Python生态系统之外被广泛使用,而pickle使用的数据格式是特定于Python的;
默认情况下,JSON只能表示Python内建数据类型,对于自定义数据类型需要一些额外的工作来完成;pickle可以直接表示大量的Python数据类型,包括自定数据类型(其中,许多是通过巧妙地使用Python内省功能自动实现的;复杂的情况可以通过实现specific object API来解决)
例如:
import pickle
def sayhi(name):
print("hi,",name)
info={
'age':23,
'name':'buffon',
'func':sayhi
}
with open('a.txt','wb') as f:
f.write(pickle.dumps(info))
而反序列化时,需要将之前序列化的函数重新写入,否则在反序列化时会报错AttributeError: Can't get attribute 'sayhi' on...(在序列化时保存的内存的地址,反序列化时找不到当时的映射关系)
反序列化:
import pickle
def sayhi(name):
print("hi,",name)
with open('a.txt','rb') as f:
data=f.read()
data1=pickle.loads(data)
print(data1)
另外pickle模块的dump和load方法与json的功能基本类似
引用了部分文章:python序列化
网友评论