我有以下相同的代码....
<a id="rowID5" class="title-link">
<div id="rowData">
<div>Some text here</div>
</div>
</a>
现在我必须使用以下代码对“a”元素执行select...
Document doc = Jsoup.parse(htmlData);
Elements row = doc.select("a.title-link");
现在当我做下面的...
for (int i = 0; i < row.size(); i++){
String foo = row.get(i).html();
break; //I break here only for Testing Purposes there will be more rows eventually
}
当然,问题是当“foo”返回时,它等于...
<div id="rowData">
<div>Some text </div>
</div>
我需要“foo”来等于原来的…
<a id="rowID5" class="title-link">
<div id="rowData">
<div>Some text here</div>
</div>
</a>
我之所以做这些,是因为我在文档上做了一个select以返回元素的内部html。然后,我的代码从元素中提取数据并执行操作(创建foo字符串的地方),然后我需要使用完整的html(包括A tag元素及其子元素)并将其设置为“foo”作为输出。
node.outerHTML()可以完成您所要查找的内容。
主要内容:Jsoup 获取HTML 语法,Jsoup 获取HTML 说明,Jsoup 获取HTML 示例以下示例将展示在将 HTML 字符串解析为 Document 对象后获取内部 html 和外部 html 的方法的使用。 Jsoup 获取HTML 语法 document :文档对象代表 HTML DOM。 Jsoup : 解析给定 HTML 字符串的主类。 html : HTML 字符串。 link : 元素对象表示表示锚标记的 html 节点元素。 link.outerHtml() : o
我正在刮网页使用JSoup库通过选择类属性,其中包含"nav"字符串。 这是获取网站超文本标记语言的代码: 正如您所看到的,id=“varPreviewMenu”的ul元素包含Jsoup检索到的HTML不包含的li元素。 我怎样才能得到那些元素?
我是jsoup的新手,在使用非HTML元素(脚本)时遇到了一些困难。我有以下HTML: 用于显示这一点的应用程序知道如何处理 和.语句。因此,当我简单地用jsoup解析文本时,<和>被编码,html被重新组织,所以它不能正确地执行或显示。例如: 我的最终目标是添加一些css和js包含,并修改几个元素属性。那真的不是问题,我已经解决了那么多了。问题是我不知道如何保留非HTML元素,并将格式与原始格式
我是Jsoup解析的新手,我想获得这个页面上所有公司的列表:https://angel.co/companies?company_types[]=startup现在,一种实现这一点的方法实际上是使用与我需要的相关的div标记来检查页面。但是,当我调用该方法时: 首先,我甚至无法在我的consol html输出中找到那些DIV标记(这些标记应该给出公司的列表);其次,即使我找到了它,我如何才能找到具
我一直在研究用于数据提取的Jsoup示例,并提取了此链接的一个示例 J汤