问题：

Xpath表达式提取多个项，尽管用[]指定了item

通迪

2023-03-14

我试图编写一个XPath表达式，它可以返回与搜索的下一页相关联的URL。

导致搜索下一页的URL始终是href中的a标记span class=“navcurrentpage”之后的标记中的href我一直试图使用follow-sibling术语来提取下一个URL。我在Chrome控制台中的搜索是：

$x('//span[@class="navCurrentPage"][1]/following-sibling::a/@href[1]')

我认为通过指定@href[1]，我只能返回一个URL（认为[1]选择列表中的第一个元素），但Chrome（和Scrapy）返回了四个URL。我不明白为什么。请帮助我了解如何选择一个URL我正在寻找。

以下是您可以找到给我带来麻烦的HTML的URL：

https://www.yachtworld.com/core/listing/cache/searchresults.jsp?cit=true&slim=quick&ybw=&sm=3&searchtype=advancedsearch&ntk=boatsen&ntt=&is=false&man=&hmid=102&ftid=0&type=%28sail 115&RID=116&RID=128&RID=130&RID=153&pbsint=&boatsaddedselected=-1

谢谢你的帮助。

共有1个答案

龚沛

2023-03-14

运算符优先级://x[1]表示/descendant-or-self::node()/child::x[1]，它查找其父级的第一个子级x的每个子级。您需要(//x)[1]，它在所有名为x的后代中找到第一个节点。

类似资料：

Microsoft SQL Server 使用XPath表达式指定结构

本文向大家介绍Microsoft SQL Server 使用XPath表达式指定结构，包括了Microsoft SQL Server 使用XPath表达式指定结构的使用技巧和注意事项，需要的朋友参考一下示例在中FOR XML PATH，没有名称的列成为文本节点。NULL或''因此成为空文本节点。注意：您可以通过使用将已命名的列转换为未命名的列AS * 使用（空）文本节点有助于将先前的输出节点与
XPath表达式

主要内容：示例XPath表达式通常定义模式以便选择一组节点。这些模式由XSLT用于执行转换，或者由用于寻址。 XPath规范指定了七种类型的节点，这些节点可以是XPath表达式的执行输出。根元素文本属性注释处理指令命名空间 XPath使用路径表达式从XML文档中选择节点或节点列表。以下是从XML文档中选择节点/节点列表的路径和表达式列表。序号表达式描述 1 选择具有给定名称的所有节点。
用XPath表达式从HTML span元素中提取全文

我有一个HTML树，看起来如下所示：我试图用以下XPath表达式从span中提取所有文本：然而，这种方法只返回第一个文本行，直到中断？问题是：为了提取HTML span标记的全文内容，我将如何以正确的方式处理这个问题？我将非常感谢任何帮助，并预先感谢您的支持。
错误：``在包含外部引用的聚合表达式中指定了多个列。''

问题内容：尝试执行以下查询时，我收到此错误。有什么想法或建议吗？错误：在包含外部引用的聚合表达式中指定了多个列。如果要聚合的表达式包含外部引用，则该外部引用必须是表达式中唯一引用的列。问题答案：问题是您不能在聚合函数中组合外部和内部引用因此将其更改为这是更详尽的解释。
如何使用许多OR替代项来缩短XPath长表达式？

问题内容：我正在努力让Selenium经历大量替代条件XPath，寻找可能匹配的元素，并将其传递给对象。当前，使用运算符（），代码很快变得非常重复和详尽，特别是当存在很多可能的变化时。在下面的例子中，唯一的变化是，我开始寻找，或。其余部分相同。但在我实际的代码，我将寻求更加变化，包括在不同的节点类型，除了和。问题：有什么方法可以简化（缩短）该过程吗？我的第一个希望是，可以做类似的
提取正则表达式匹配项的一部分

问题内容：我想要一个正则表达式从HTML页面提取标题。目前我有这个：是否有一个正则表达式仅提取的内容，所以我不必删除标签？问题答案：用在正则表达式和python中检索捕获的字符串（将返回如果没有找到结果，所以不要用直接）：

Xpath表达式提取多个项，尽管用[]指定了item

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档