MessagePack
MessagePack是一个基于二进制高效的对象序列化类库,可用于跨语言通信。
它可以像JSON那样,在许多种语言之间交换结构对象。
但是它比JSON更快速也更轻巧。
支持Python、Ruby、Java、C/C++等众多语言。宣称比Google Protocol Buffers还要快4倍。
兼容 json和pickle。
安装
$ pip install msgpack
常用方法:
packb 序列化对象。提供了dumps来兼容pickle和json。
unpackb 反序列化对象。提供了loads来兼容。
pack 序列化对象保存到文件对象。提供了dump来兼容。
unpack 反序列化对象保存到文件对象。提供了load来兼容。
import pickle
import json
import msgpack
# 导入的模块,就是标识符
methods = (pickle, json, msgpack) d = {'person': [{'name': 'tom', 'age': 18}, {'name': 'jerry', 'age': 16}],
'total': 2}
for m in methods:
s = m.dumps(d)
print(m.__name__, type(s), len(s), s)
# pickle 101
# json 72
# msgpack 48
print('-' * 30) u = msgpack.loads(s)
print(type(u), u)
u2 = msgpack.loads(s, raw=False) # 新版,raw=True数据使用bytes
print(type(u2), u2)
MessagePack简单易用,高效压缩,支持语言丰富。
所以,用它序列化也是一种很好的选择。Python很多大名鼎鼎的库都是用了msgpack。
上例中,之所以pickle比json序列化的结果还要大,原因主要是pickle要解决所有Python类型数据的序列化,要记录各种数据类型包括自定义的类。而Json只需要支持少数几种类型,所以就可以很简单,都不需要类型的描述字符。但大多数情况下,我们序列化的数据都是这些简单的类型。