当前位置: 首页 > 面试题库 >

将urllib2提取的压缩数据转换为HTML

易宣
2023-03-14
问题内容

我目前使用机械化来读取压缩的网页,如下所示:

br = mechanize.Browser()
br.set_handle_gzip(True)
response = br.open(url)
data = response.read()

我想知道如何将urllib2提取的压缩数据解压缩为HTML文本?

req = urllib2.Request(url)
opener = urllib2.build_opener()
response = opener.open(req)
data = response.read()
if response.info()['content-encoding'] == 'gzip':
    HOW TO DECOMPRESS DATA TO HTML

问题答案:

尝试这个:

import StringIO
data = StringIO.StringIO(data)
import gzip
gzipper = gzip.GzipFile(fileobj=data)
html = gzipper.read()

html现在应该包含HTML(将其 打印以查看
)。有关更多信息,请参见此处。



 类似资料:
  • 我试图解压缩一个csv文件并将其传递给熊猫,这样我就可以处理这个文件了。 到目前为止,我尝试的代码是: 在最后一行之后,尽管python能够获取该文件,但在错误的末尾我得到了一个“不存在”。 有人能告诉我我做错了什么吗?

  • 问题内容: 新来的! 情况:我正在一个需要与AS / 400服务器通信的项目中。我的任务是基本上处理将发送到AS / 400服务器的请求。为此,所有用户输入都应以EDCDIC字节为单位。 问题: 我已经设法通过以下代码将打包的小数转换为String,该代码可在该论坛上找到: 我现在的问题是我必须再次将这些字符串值转换为EBCDIC字节,以便AS / 400服务器可以理解它。我打算做一些事情,例如使

  • 问题内容: 我有一堆高质量的PNG文件。我想使用PHP将它们转换为JPG,因为它的文件较小,同时又保持了质量。我想在网上显示JPG文件。 PHP是否具有执行此操作的功能/库?质量/压缩度好吗? 问题答案: 这样做可以将PNG安全地转换为白色透明的JPG。

  • 我使用Ubuntu OS中的RawTherapee应用程序将RAW文件转换为TIF。 是否存在任何专有问题或与Adobe名称使用有关的任何问题?我喜欢使用开源工具和应用程序。请把你关心的问题告诉我。

  • 问题内容: 我正在尝试将以下feed解析为python中的ElementTree:“ http://smarkets.s3.amazonaws.com/oddsfeed.xml ”(警告大文件) 到目前为止,这是我尝试过的: 但是它似乎只是挂在上面,也许是无限地??(我知道这是一个大文件,但与我解析的其他非压缩提要相比似乎太长了,而这个大文件首先会扼杀gzip压缩带来的任何带宽增长)。 接下来我尝

  • 我有一个COBOL程序,它生成具有以下结构的顺序文件: 如果我在记事本++中打开该文件,我会看到奇怪的unicode符号,这些符号是由变量引起的,很难读取。类似于下面图像的内容(图像来自另一个文件): 有没有办法不使用COBOL重写这个顺序文件以使其可读?也许使用像VBS这样的脚本语言?任何提示或建议将被感谢,如果你需要更多的信息让我知道,我会编辑的帖子。