zlib.error：解压缩时出错-3：不正确的标头检查

傅长恨

2023-03-14

问题内容：

我有一个gzip文件，我正尝试通过Python读取它，如下所示：

import zlib

do = zlib.decompressobj(16+zlib.MAX_WBITS)
fh = open('abc.gz', 'rb')
cdata = fh.read()
fh.close()
data = do.decompress(cdata)

它抛出此错误：

zlib.error: Error -3 while decompressing: incorrect header check

我该如何克服？

问题答案：

更新：dnozay的答案解释了该问题，应该是公认的答案。

您有此错误：

zlib.error: Error -3 while decompressing: incorrect header check

这很可能是因为您试图检查不存在的标头，例如您的数据遵循RFC 1951（deflate压缩格式）而不是RFC 1950（zlib压缩格式）或RFC 1952（gzip压缩格式）。

选择windowBits

但是zlib可以解压缩所有这些格式：

（解压缩）deflate格式，使用wbits = -zlib.MAX_WBITS
（解压缩）zlib格式，使用wbits = zlib.MAX_WBITS
（解压缩）gzip格式，使用wbits = zlib.MAX_WBITS | 16

请参阅http://www.zlib.net/manual.html#Advanced（部分inflateInit2）中的文档

例子

测试数据：

>>> deflate_compress = zlib.compressobj(9, zlib.DEFLATED, -zlib.MAX_WBITS)
>>> zlib_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS)
>>> gzip_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS | 16)
>>> 
>>> text = '''test'''
>>> deflate_data = deflate_compress.compress(text) + deflate_compress.flush()
>>> zlib_data = zlib_compress.compress(text) + zlib_compress.flush()
>>> gzip_data = gzip_compress.compress(text) + gzip_compress.flush()
>>>

明显的测试zlib：

>>> zlib.decompress(zlib_data)
'test'

测试deflate：

>>> zlib.decompress(deflate_data)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(deflate_data, -zlib.MAX_WBITS)
'test'

测试gzip：

>>> zlib.decompress(gzip_data)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|16)
'test'

数据还与gzip模块兼容：

>>> import gzip
>>> import StringIO
>>> fio = StringIO.StringIO(gzip_data)  # io.BytesIO for Python 3
>>> f = gzip.GzipFile(fileobj=fio)
>>> f.read()
'test'
>>> f.close()

自动标头检测（zlib或gzip）

加入32到windowBits将触发标题检测

>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|32)
'test'
>>> zlib.decompress(zlib_data, zlib.MAX_WBITS|32)
'test'

使用gzip代替或者您可以忽略zlib并gzip直接使用模块；但请记住，在引擎盖下，gzip使用zlib。

fh = gzip.open('abc.gz', 'rb')
cdata = fh.read()
fh.close()

试试这个gzip模块，下面的代码直接来自python
docs
。

import gzip
f = gzip.open('/home/joe/file.txt.gz', 'rb')
file_content = f.read()
f.close()

zlib.error：解压缩时出错-3：不正确的标头检查

相关阅读

相关文章

相关问答

相关工具

相关文档