当前位置: 首页 > 知识库问答 >
问题:

Scrapy crawler中的URL不会屈服于下一个解析器

杜阳泽
2023-03-14

我在爬的时候遇到了一个问题http://www.brand-in-trend.ru. 正如您在下面看到的,我使用Scrapy并定义了Basespider。第一个解析器工作得非常好,返回在start\u url上找到的所有品牌。

现在,当我想向类别解析器产生回调请求时,我没有得到响应,也没有得到错误。蜘蛛刚刚退出。

蜘蛛网:

class brandintrend(BaseSpider):
name = "brandintrend"

allowed_domains = [ 'trend-in-brand.ru' ]

start_urls      = [ 'http://brand-in-trend.ru/brands/' ]

def parse(self, response):
    hxs         = HtmlXPathSelector(response)
    brands      = hxs.select('//div[@class="brandcol"]/ul/li/a/@href').extract()

    for brand in brands:
        brand = "http://www.brand-in-trend.ru" + brand
        print brand
        # request = Request(brand, callback=self.categories)
        yield Request(brand, callback=self.categories)

def categories(self, response):
    print "Hello World"
    hxs = HtmlXPathSelector(response)
    print response.url

我已经尝试了以下方法来解决此问题:

  1. 测试了生成的品牌URL(例如。http://www.brand-in-trend.ru/brands/parker/)在Chrome中(Javasript关闭),它们工作正常。

如果有人遇到类似的问题,我将非常乐意提供解决方案或建议

提前谢谢

J

共有1个答案

仲俊豪
2023-03-14

这是因为你设置了:

allowed_domains = [ 'trend-in-brand.ru' ]

但是,您正在从其他域抓取url:

start_urls = [ 'http://brand-in-trend.ru/brands/' ]

请参见品牌趋势与品牌趋势。

 类似资料:
  • 我正在写一个小程序,介绍如何计算网格中给定位置的邻域之和。由于某些原因,程序无法识别正确的值。我想知道这可能是因为我使用了try-catch来限制出界,还是我错过了什么? 我使用的是一个简单的3x3网格,编号为1-9。我在许多其他测试中使用了相同的矩阵,因此假设网格没有问题。即使我在一步一步地调试和检查时得到了11。我不太明白,有人有主意吗? 和中的-1只是将其强制为11(2 4 5),但程序在运

  • 问题内容: 如何使用JavaScript(以及jQuery)解析URL? 例如,我的字符串中有这个 我想得到的价值 我知道我可以使用PHP轻松地做到这一点,但我想知道JavaScript怎么可能。 问题答案: 您可以使用创建-element的技巧,将URL添加到其中,然后使用其Location对象。 将输出: 您也可以使用php.js来获取JavaScript中的parse_url函数] 更新(2

  • 我正在解析URL中的数据,下面提到了这个错误。 原始数据从服务器完美显示。无法使用Json解析拆分数据。 请帮我解决这个错误 编辑:1 来自URL的Json响应 错误: 主要活动。JAVA

  • 在我正在学习的书中,有一个练习: 编写一个循环,交换整数数组的相邻元素。例如,变成了。我的解决方案是: 该算法运行良好,但并没有完全利用Scala的潜力,就像我用C语言写的一样。 重复前面的赋值,但是用交换的值生成一个新数组。用于/产出。 现在我尝试了: 错误是:“值更新不是 scala.collection.immutable.IndexedSeq[Int] 的成员” 我该如何解决这个任务?我知

  • 问题内容: 我需要解析一个URL以获得链接到详细信息页面的URL列表。然后,需要从该页面获取该页面的所有详细信息。我需要这样做,因为详细信息页面的URL不会定期增加和更改,但是事件列表页面却保持不变。 基本上: 问题答案: 它会给你URL列表。现在,您可以遍历这些URL并解析数据。 这是一个例子。您可以阅读BeautifulSoup教程。

  • 本文向大家介绍如何解析JavaScript中的URL?,包括了如何解析JavaScript中的URL?的使用技巧和注意事项,需要的朋友参考一下 解析URL 通过使用DOM方法而不是正则表达式来解析javascript中的URL是非常简单的。如果使用正则表达式,则代码将更加复杂。在DOM方法中,仅一个函数调用将返回已解析的URL。  在以下示例中,首先创建一个函数,然后使用DOM方法在其内部创建锚标