XHR请求URL表示尝试解析其内容时不存在

南宫星波

2023-03-14

问题内容：

在使用Scrapy为我的问题构建完整的解决方案之前，我先发布了我想做的一个简单版本：

import requests

url = 'http://www.whoscored.com/stageplayerstatfeed/?field=1&isAscending=false&orderBy=Rating&playerId=-1&stageId=9155&teamId=32"'

params = {'d': date.strftime('%Y%m'), 'isAggregate': 'false'}
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1985.125 Safari/537.36'}

response = requests.get(url, params=params, headers=headers)

fixtures = response.body
#fixtures = literal_eval(response.content)
print fixtures

此代码表示上述URL不存在。该URL与XHR请求相关，当您从此页面上的主表的“总体”选项卡切换到“主页”选项卡时，将提交该XHR请求：

http://www.whoscored.com/Teams/32/

如果您在Google Developer Tools的控制台中激活XHR日志记录，则可以以字典的形式（期望的格式）看到XHR请求和从服务器发送的响应。

谁能告诉我为什么上面的代码没有返回我希望看到的数据？

谢谢

问题答案：

您有几个问题：

网址应该是 http://www.whoscored.com/stageplayerstatfeed
GET参数错误
缺少重要的必需标头
你需要response.json()而不是response.body

固定版本：

import requests

url = 'http://www.whoscored.com/stageplayerstatfeed'
params = {
    'field': '1',
    'isAscending': 'false',
    'orderBy': 'Rating',
    'playerId': '-1',
    'stageId': '9155',
    'teamId': '32'
}
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1985.125 Safari/537.36',
           'X-Requested-With': 'XMLHttpRequest',
           'Host': 'www.whoscored.com',
           'Referer': 'http://www.whoscored.com/Teams/32/'}

response = requests.get(url, params=params, headers=headers)

fixtures = response.json()
print fixtures

印刷品：

[
    {
        u'AccurateCrosses': 0,
        u'AccurateLongBalls': 10,
        u'AccuratePasses': 89,
        u'AccurateThroughBalls': 0,
        u'AerialLost': 2,
        u'AerialWon': 4,
        ...
    },
    ...
]

XHR请求URL表示尝试解析其内容时不存在

相关阅读

相关文章

相关问答

相关工具

相关文档