Python内部对象序列化 (marshal)


尽管Python标准库中的marshal模块提供了对象序列化功能(类似于pickle模块),但它并不真正适用于通用数据持久化或通过套接字等传输Python对象。此模块主要由Python本身用于支持编译版本的Python模块(.pyc文件)的读写操作。marshal模块使用的数据格式在Python版本之间不兼容(甚至子版本也不兼容)。这就是为什么一个版本的编译Python脚本(.pyc文件)很可能无法在另一个版本上执行的原因。因此,marshal模块用于Python的内部对象序列化。

与pickle模块一样,marshal模块也定义了load()和dump()函数,用于从文件读取和写入marshaled对象。此外,loads()和dumps()函数处理marshaled对象的字符串表示形式。

dumps() − 通过将Python对象进行marshal处理,返回一个类似字节的对象。仅支持标准数据类型的对象进行marshal处理。不支持的类型会引发ValueError异常。

loads() − 此函数将类似字节的对象转换为相应的Python对象。如果转换结果不是有效的Python对象,则可能会引发ValueError或TypeError异常。

以下代码显示了使用dumps()进行marshal处理的Python字典对象。字节表示形式通过loads()函数转换回字典。

import marshal
person = {"name":"xyz", "age":22, "marks":[45,56,78]}
data = marshal.dumps(person)
obj = marshal.loads(data)
print (obj)

dump() − 此函数将支持的Python对象的字节表示形式写入文件。文件本身必须是具有写入权限的二进制文件。

load() − 此函数从二进制文件读取字节数据并将其转换为Python对象。

如上所述,marshal模块用于处理.pyc文件。以下示例演示了如何使用dump()和load()函数来处理Python的代码对象,这些对象用于存储预编译的Python模块。

该代码使用内置的compile()函数根据包含Python指令的源字符串构建代码对象。

compile(source, file, mode)

file参数应为读取代码的文件。如果未从文件读取,则传递任何任意字符串。

如果源包含一系列语句,则mode参数为'exec';如果只有一个表达式,则为'eval';如果包含单个交互式语句,则为'single'。

然后使用dump()函数将编译后的代码对象存储在.pyc文件中。

import marshal
script = """
a = 10
b = 20
print ('addition = ',a+b)
"""
code = compile(script, "script", "exec")
f = open("a.pyc","wb")
marshal.dump(code, f)
f.close()

要从.pyc文件中反序列化对象,请使用load()函数。因为它返回一个代码对象,所以可以使用另一个内置函数exec()来运行它。

import marshal
f = open("a.pyc","rb")
data = marshal.load(f)
exec (data)

输出将是嵌入在源字符串中的代码块的结果。

addition = 30

更新于:2020年6月27日

943 次浏览

启动你的职业生涯

完成课程获得认证

开始学习
广告