问题：

Scrapy crawler中的URL不会屈服于下一个解析器

杜阳泽

2023-03-14

我在爬的时候遇到了一个问题http://www.brand-in-trend.ru. 正如您在下面看到的，我使用Scrapy并定义了Basespider。第一个解析器工作得非常好，返回在start\u url上找到的所有品牌。

现在，当我想向类别解析器产生回调请求时，我没有得到响应，也没有得到错误。蜘蛛刚刚退出。

蜘蛛网：

class brandintrend(BaseSpider):
name = "brandintrend"

allowed_domains = [ 'trend-in-brand.ru' ]

start_urls      = [ 'http://brand-in-trend.ru/brands/' ]

def parse(self, response):
    hxs         = HtmlXPathSelector(response)
    brands      = hxs.select('//div[@class="brandcol"]/ul/li/a/@href').extract()

    for brand in brands:
        brand = "http://www.brand-in-trend.ru" + brand
        print brand
        # request = Request(brand, callback=self.categories)
        yield Request(brand, callback=self.categories)

def categories(self, response):
    print "Hello World"
    hxs = HtmlXPathSelector(response)
    print response.url

我已经尝试了以下方法来解决此问题：

我测试了生成的品牌URL（例如。http://www.brand-in-trend.ru/brands/parker/)在Chrome中（Javasript关闭），它们工作正常。

如果有人遇到类似的问题，我将非常乐意提供解决方案或建议

提前谢谢

共有1个答案

仲俊豪

2023-03-14

这是因为你设置了：

allowed_domains = [ 'trend-in-brand.ru' ]

但是，您正在从其他域抓取url：

start_urls = [ 'http://brand-in-trend.ru/brands/' ]

请参见品牌趋势与品牌趋势。

类似资料：

邻居不会屈服

我正在写一个小程序，介绍如何计算网格中给定位置的邻域之和。由于某些原因，程序无法识别正确的值。我想知道这可能是因为我使用了try-catch来限制出界，还是我错过了什么？我使用的是一个简单的3x3网格，编号为1-9。我在许多其他测试中使用了相同的矩阵，因此假设网格没有问题。即使我在一步一步地调试和检查时得到了11。我不太明白，有人有主意吗？和中的-1只是将其强制为11（2 4 5），但程序在运
解析JavaScript中的URL

问题内容：如何使用JavaScript（以及jQuery）解析URL？例如，我的字符串中有这个我想得到的价值我知道我可以使用PHP轻松地做到这一点，但我想知道JavaScript怎么可能。问题答案：您可以使用创建-element的技巧，将URL添加到其中，然后使用其Location对象。将输出：您也可以使用php.js来获取JavaScript中的parse_url函数] 更新（2
Android中Url的Json解析，不起作用

我正在解析URL中的数据，下面提到了这个错误。原始数据从服务器完美显示。无法使用Json解析拆分数据。请帮我解决这个错误编辑：1 来自URL的Json响应错误：主要活动。JAVA
Scala for/屈服语法

在我正在学习的书中，有一个练习：编写一个循环，交换整数数组的相邻元素。例如，变成了。我的解决方案是：该算法运行良好，但并没有完全利用Scala的潜力，就像我用C语言写的一样。重复前面的赋值，但是用交换的值生成一个新数组。用于/产出。现在我尝试了：错误是：“值更新不是 scala.collection.immutable.IndexedSeq[Int] 的成员” 我该如何解决这个任务？我知
美丽的汤来解析URL以获取另一个URL数据

问题内容：我需要解析一个URL以获得链接到详细信息页面的URL列表。然后，需要从该页面获取该页面的所有详细信息。我需要这样做，因为详细信息页面的URL不会定期增加和更改，但是事件列表页面却保持不变。基本上：问题答案：它会给你URL列表。现在，您可以遍历这些URL并解析数据。这是一个例子。您可以阅读BeautifulSoup教程。
如何解析JavaScript中的URL？

本文向大家介绍如何解析JavaScript中的URL？，包括了如何解析JavaScript中的URL？的使用技巧和注意事项，需要的朋友参考一下解析URL 通过使用DOM方法而不是正则表达式来解析javascript中的URL是非常简单的。如果使用正则表达式，则代码将更加复杂。在DOM方法中，仅一个函数调用将返回已解析的URL。在以下示例中，首先创建一个函数，然后使用DOM方法在其内部创建锚标

Scrapy crawler中的URL不会屈服于下一个解析器

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档