因为涉及二进制串和字节处理,所以包含的知识是比较底层的。
首先要知道 struct 中的 pack 和 unpack 是用来完成数据结构和字节流之间转换的,也就是说,这两个函数是在转换数据的表示形式,并不会改变数据。
比如 int a = 4; 这里的 a 转换通过'i' format 成字节流为: \x04\x00\x00\x00 (大端序为 \x00\x00\x00\x04)。
以上或者反过来。
那么简洁地说:
为什么要转换?
为了迎合处理字节流,比如 构造网络包来发送,或者解析接收的网络包。
怎么转?
这就是函数(主要就是 pack 和 unpack)的使用方法。 pack(format, value1, value2...) unpack(format, string)
其中:
pack函数将普通的数据结构转成字节流,你自然要提供一个 format, 这个 format 描述了你要操作的后面许多value的数据类型,从而按照这个描述生成的有意义的字节流。 而 接收到的字节流 或者 之前生成的字节流,可以通过unpack函数来解析,一大段字节来了,你要解析,自然需要描述一下这个字节流我该在哪里切分一下,应该用什么顺序等,这就是format在做的事情。
format 该怎么写?
请自行查询这里 format 的语法。
特别的,由于系统本身处理字符串的差异,在描述数据类型的format参数的开头,也可能有(可缺省)描述format方式的符号(比如字节顺序),具体同format 语法,请自行查询。
所以,我们来看你的这段代码:
1.代码中的tag,即为 format 变量。
tag = '>h' if self.endian == HIGHT_ENDIAN else 'h'
这里通过判断 字节顺序,来判断是否添加 大端字节序描述符‘>’ 到format前,'h'在format语法中代表 2字节长度的 C语言 short类型(Python中的 integer )。
2. 保存value长度
length = len(value)
self.buffer += (struct.pack(tag, length))
求的value的长度,现在的tag值为“h”或者“>h”, 来表示长度length, 调用函数生成字节流添加到buffer的尾端。
3. 保存value的值
tag = '%ss' % (length)
self.buffer += (struct.pack(tag, value))
先生成描述value的format,然后pack,添加到buffer尾端。