我在过去使用过JSoup并能够将XPath转换为选择器,但是在一个已经改变的站点上,我无法获得这个表的结果。
Firefox为表提供了一个类似的选择器。placeholder>表:nth-child(12)>tbody:nth-child(1)>tr:nth-child(1)>td:nth-child(1)>tbody:nth-child(1)>tr:nth-child(1)>td:nth-child(1)>表:nth-child(1)
两个都不起作用。即使在Try JSoup链接
第一个第n个子表本身#tabs-1>div>table:nth-child(12)
返回NULL。
你知道这个页面有什么特别之处吗?
我将用户代理字符串设置为Mozilla/5.0(Windows NT 10.0;WOW64)AppleWebkit/537.36(KHTML,像Gecko)Chrome/49.0.2623.112 Safari/537.36
我想你在JSOUP中发现了一个bug。但是,这里有一个提取表的变通方法:
table#Table6 + table > tbody:has(tr.theadb)
演示
主要内容:Jsoup 选择器 语法,Jsoup 选择器 说明,Jsoup 选择器 示例以下示例将展示在将 HTML 字符串解析为 Document 对象后选择器方法的使用。jsoup 支持类似于 CSS 选择器的选择器。 Jsoup 选择器 语法 document : 文档对象代表 HTML DOM。 Jsoup : 解析给定 HTML 字符串的主类。 html : HTML 字符串。 sampleDiv : 元素对象表示由 id“sampleDiv”标识的 html 节点元素。
我正在尝试使用JSoup从网站上刮取一些内容。以下是我感兴趣的页面中的一些HTML内容示例: 我有兴趣获得页面中所有的列表(所以"Fizz","Buzz","Foo"和"Bar")。但是我不能只查询,因为他们到处都在使用类来装饰许多不同的元素。具体来说,我需要存在于元素中的所有。请注意,pbks可以包含0个pgs,pgs可以包含0个热词,热词可以包含1个其他热词。我有以下代码: 运行该代码将生成以
本文向大家介绍Jsoup 使用CSS选择器选择元素,包括了Jsoup 使用CSS选择器选择元素的使用技巧和注意事项,需要的朋友参考一下 示例 您可以在此处找到支持的选择器的详细概述。
我正在为EJB服务开发一个REST-facade,这意味着它调用EJB,将结果转换为REST调用者将理解的表示,然后返回它(作为json或xml)。所有这些都非常出色。但是EJB服务抛出了各种异常,例如,当没有找到结果或其他一些不同的情况下。因为我不希望那些传播到REST调用者,所以我实现了一个ExceptionMapper: 我的EJB服务中的所有异常都以,此映射程序可以很好地捕获它,原因是应用
我试图使用JSoup从超文本标记语言文档中选择一些文本。 我感兴趣的超文本标记语言是表单的一部分: 我对获取任何
我检查了这个问题,在elasticsearch中查询DSL中必须和过滤器有什么区别?并阅读答案。 据我所知,必须和过滤器应该返回相同的结果。我说的对吗?但是当我把过滤查询改为必须时,我收到了更多的结果?我做错了什么? 我比较了过滤器,必须查询并得到不同的结果。