当前位置: 首页 > 面试题库 >

使用Python请求获取HEAD内容

林夕
2023-03-14
问题内容

我正在尝试解析使用Python Requests库完成的HEAD请求的结果,但似乎无法访问响应内容。

根据文档,我应该能够从request.Response.text访问内容。这对GET请求对我来说效果很好,但对HEAD请求返回None。

GET请求(有效)

import requests
response = requests.get(url)
content = response.text

内容= <html>...</html>

HEAD请求(无内容)

import requests
response = requests.head(url)
content = response.text

内容= None

编辑

好的,我很快就从答案中意识到,HEAD请求不应返回仅内容标头。但这是否意味着,要访问在<head>页面标签(例如<link><meta>标签)中找到的内容,必须获取整个文档?


问题答案:

根据定义,对HEAD请求的响应不包含消息正文。

如果您希望获得响应正文,请发送GET请求。如果您只对响应状态代码和标头感兴趣,请发送HEAD请求。

HTTP传输任意内容;HTTP术语
与HTML完全无关<head>。但是,建议使用HTTP仅下载文档的一部分。如果您知道HTML<head>代码的长度(或其上限),则可以在请求中包含HTTP
Range
标头,建议远程服务器仅返回一定数量的字节。如果远程服务器支持HTTP范围,则它将提供简化的答案。



 类似资料:
  • 问题内容: 我正在尝试教自己一些基本的网络抓取。使用Python的请求模块,在尝试以下操作之前,我能够抓取各种网站的html: 我得到的不是基本的html,而是本页面的内容: 我已经尝试过将get / post与我可以从文档,SO和其他示例中猜到的每种语法进行多种组合。我不明白上面看到的内容,无法将其转换为可以阅读的任何内容,也无法弄清楚如何获得自己真正想要的东西。我的问题是,如何获取以上页面的h

  • 问题内容: 尝试使用Requests会话发出一个简单的get请求,但是我一直在获取特定网站的SSLerror。我认为问题可能出在网站上(我使用https://www.ssllabs.com进行了扫描,结果下降了),但是我不确定,因为我对该领域一无所知:)我想了解发生了什么。 一个解决方案/解释将是巨大的,谢谢! 编码: 我收到下一个错误: 我在https://www.ssllabs.com上进行了

  • 问题内容: 我使用请求库从网站上获取了一些cookie,但是我只能从响应中获取cookie,如何从请求中获取cookie?谢谢! 问题答案: 或者,您可以在请求之前和之后使用和观察:

  • 问题内容: 是否可以仅使用JavaScript中的XMLHTTPRequest来执行HTTP Head请求? 我的动机是节省带宽。 如果没有,有可能假冒吗? 问题答案: 简单,只需使用HEAD方法,而不是GET或POST: 这只是展示如何使用HEAD方法的简短示例。生产代码可能需要针对不同的结果状态(成功,失败,超时)更细粒度的回调,并可能使用不同的事件处理程序(,而不是)。

  • 问题内容: 我正在尝试使用Python 2进行页面的HEAD请求。 我在尝试 与包含 但是我越来越 如果我只是做 然后就可以了 问题答案: 这很好用: 经过python入侵的快速而肮脏的HTTPd的测试: 我添加了一个自定义标头字段X-REQUEST_METHOD以显示它的工作:) 这是HTTPd日志: 编辑:还有httplib2

  • 问题内容: 尝试在Python中获取HTTP响应内容的原始数据。我有兴趣通过另一个渠道转发响应,这意味着理想情况下,内容应尽可能原始。 什么是做到这一点的好方法? 问题答案: 如果使用呼叫获取HTTP响应,则可以使用响应的属性。这是docs中的代码。