当前位置: 首页 > 知识库问答 >
问题:

JSoup选择器未返回结果

盖斌
2023-03-14

我在过去使用过JSoup并能够将XPath转换为选择器,但是在一个已经改变的站点上,我无法获得这个表的结果。

Firefox为表提供了一个类似的选择器。placeholder>表:nth-child(12)>tbody:nth-child(1)>tr:nth-child(1)>td:nth-child(1)>tbody:nth-child(1)>tr:nth-child(1)>td:nth-child(1)>表:nth-child(1)

两个都不起作用。即使在Try JSoup链接

第一个第n个子表本身#tabs-1>div>table:nth-child(12)返回NULL。

你知道这个页面有什么特别之处吗?

我将用户代理字符串设置为Mozilla/5.0(Windows NT 10.0;WOW64)AppleWebkit/537.36(KHTML,像Gecko)Chrome/49.0.2623.112 Safari/537.36

共有1个答案

费和惬
2023-03-14

我想你在JSOUP中发现了一个bug。但是,这里有一个提取表的变通方法:

table#Table6 + table > tbody:has(tr.theadb)

演示

 类似资料:
  • 主要内容:Jsoup 选择器 语法,Jsoup 选择器 说明,Jsoup 选择器 示例以下示例将展示在将 HTML 字符串解析为 Document 对象后选择器方法的使用。jsoup 支持类似于 CSS 选择器的选择器。 Jsoup 选择器 语法 document : 文档对象代表 HTML DOM。 Jsoup : 解析给定 HTML 字符串的主类。 html : HTML 字符串。 sampleDiv : 元素对象表示由 id“sampleDiv”标识的 html 节点元素。

  • 我正在尝试使用JSoup从网站上刮取一些内容。以下是我感兴趣的页面中的一些HTML内容示例: 我有兴趣获得页面中所有的列表(所以"Fizz","Buzz","Foo"和"Bar")。但是我不能只查询,因为他们到处都在使用类来装饰许多不同的元素。具体来说,我需要存在于元素中的所有。请注意,pbks可以包含0个pgs,pgs可以包含0个热词,热词可以包含1个其他热词。我有以下代码: 运行该代码将生成以

  • 本文向大家介绍Jsoup 使用CSS选择器选择元素,包括了Jsoup 使用CSS选择器选择元素的使用技巧和注意事项,需要的朋友参考一下 示例 您可以在此处找到支持的选择器的详细概述。

  • 我正在为EJB服务开发一个REST-facade,这意味着它调用EJB,将结果转换为REST调用者将理解的表示,然后返回它(作为json或xml)。所有这些都非常出色。但是EJB服务抛出了各种异常,例如,当没有找到结果或其他一些不同的情况下。因为我不希望那些传播到REST调用者,所以我实现了一个ExceptionMapper: 我的EJB服务中的所有异常都以,此映射程序可以很好地捕获它,原因是应用

  • 我试图使用JSoup从超文本标记语言文档中选择一些文本。 我感兴趣的超文本标记语言是表单的一部分: 我对获取任何

  • 我检查了这个问题,在elasticsearch中查询DSL中必须和过滤器有什么区别?并阅读答案。 据我所知,必须和过滤器应该返回相同的结果。我说的对吗?但是当我把过滤查询改为必须时,我收到了更多的结果?我做错了什么? 我比较了过滤器,必须查询并得到不同的结果。