我正在尝试解析使用Python Requests库完成的HEAD请求的结果,但似乎无法访问响应内容。
根据文档,我应该能够从request.Response.text访问内容。这对GET请求对我来说效果很好,但对HEAD请求返回None。
GET请求(有效)
import requests
response = requests.get(url)
content = response.text
内容= <html>...</html>
HEAD请求(无内容)
import requests
response = requests.head(url)
content = response.text
内容= None
编辑
好的,我很快就从答案中意识到,HEAD请求不应返回仅内容标头。但这是否意味着,要访问在<head>
页面标签(例如<link>
和<meta>
标签)中找到的内容,必须获取整个文档?
根据定义,对HEAD请求的响应不包含消息正文。
如果您希望获得响应正文,请发送GET请求。如果您只对响应状态代码和标头感兴趣,请发送HEAD请求。
HTTP传输任意内容;HTTP术语 头
与HTML完全无关<head>
。但是,建议使用HTTP仅下载文档的一部分。如果您知道HTML<head>
代码的长度(或其上限),则可以在请求中包含HTTP
Range
标头,建议远程服务器仅返回一定数量的字节。如果远程服务器支持HTTP范围,则它将提供简化的答案。
问题内容: 我正在尝试教自己一些基本的网络抓取。使用Python的请求模块,在尝试以下操作之前,我能够抓取各种网站的html: 我得到的不是基本的html,而是本页面的内容: 我已经尝试过将get / post与我可以从文档,SO和其他示例中猜到的每种语法进行多种组合。我不明白上面看到的内容,无法将其转换为可以阅读的任何内容,也无法弄清楚如何获得自己真正想要的东西。我的问题是,如何获取以上页面的h
问题内容: 尝试使用Requests会话发出一个简单的get请求,但是我一直在获取特定网站的SSLerror。我认为问题可能出在网站上(我使用https://www.ssllabs.com进行了扫描,结果下降了),但是我不确定,因为我对该领域一无所知:)我想了解发生了什么。 一个解决方案/解释将是巨大的,谢谢! 编码: 我收到下一个错误: 我在https://www.ssllabs.com上进行了
问题内容: 我使用请求库从网站上获取了一些cookie,但是我只能从响应中获取cookie,如何从请求中获取cookie?谢谢! 问题答案: 或者,您可以在请求之前和之后使用和观察:
问题内容: 是否可以仅使用JavaScript中的XMLHTTPRequest来执行HTTP Head请求? 我的动机是节省带宽。 如果没有,有可能假冒吗? 问题答案: 简单,只需使用HEAD方法,而不是GET或POST: 这只是展示如何使用HEAD方法的简短示例。生产代码可能需要针对不同的结果状态(成功,失败,超时)更细粒度的回调,并可能使用不同的事件处理程序(,而不是)。
问题内容: 我正在尝试使用Python 2进行页面的HEAD请求。 我在尝试 与包含 但是我越来越 如果我只是做 然后就可以了 问题答案: 这很好用: 经过python入侵的快速而肮脏的HTTPd的测试: 我添加了一个自定义标头字段X-REQUEST_METHOD以显示它的工作:) 这是HTTPd日志: 编辑:还有httplib2
问题内容: 尝试在Python中获取HTTP响应内容的原始数据。我有兴趣通过另一个渠道转发响应,这意味着理想情况下,内容应尽可能原始。 什么是做到这一点的好方法? 问题答案: 如果使用呼叫获取HTTP响应,则可以使用响应的属性。这是docs中的代码。