问题：

使用jSoup获取内部html和当前元素html

益英逸

2023-03-14

我有以下相同的代码....

<a id="rowID5" class="title-link">
 <div id="rowData">
  <div>Some text here</div>
 </div>
</a>

现在我必须使用以下代码对“a”元素执行select...

Document doc = Jsoup.parse(htmlData);
Elements row = doc.select("a.title-link");

现在当我做下面的...

for (int i = 0; i < row.size(); i++){
 String foo = row.get(i).html();
 break; //I break here only for Testing Purposes there will be more rows eventually
}

当然，问题是当“foo”返回时，它等于...

 <div id="rowData">
  <div>Some text </div>
 </div>

我需要“foo”来等于原来的…

<a id="rowID5" class="title-link">
 <div id="rowData">
  <div>Some text here</div>
 </div>
</a>

我之所以做这些，是因为我在文档上做了一个select以返回元素的内部html。然后，我的代码从元素中提取数据并执行操作（创建foo字符串的地方），然后我需要使用完整的html（包括A tag元素及其子元素）并将其设置为“foo”作为输出。

共有1个答案

拓拔阎宝

2023-03-14

node.outerHTML（）可以完成您所要查找的内容。

类似资料：

Jsoup 获取HTML

主要内容：Jsoup 获取HTML 语法,Jsoup 获取HTML 说明,Jsoup 获取HTML 示例以下示例将展示在将 HTML 字符串解析为 Document 对象后获取内部 html 和外部 html 的方法的使用。 Jsoup 获取HTML 语法 document ：文档对象代表 HTML DOM。 Jsoup ：解析给定 HTML 字符串的主类。 html ： HTML 字符串。 link ：元素对象表示表示锚标记的 html 节点元素。 link.outerHtml() ： o
通过使用元素内部的whats获取元素[duplicate]
使用Jsoup获取完整的HTML

我正在刮网页使用JSoup库通过选择类属性，其中包含"nav"字符串。这是获取网站超文本标记语言的代码：正如您所看到的，id=“varPreviewMenu”的ul元素包含Jsoup检索到的HTML不包含的li元素。我怎样才能得到那些元素？
使用jsoup解析保留非HTML元素

我是jsoup的新手，在使用非HTML元素（脚本）时遇到了一些困难。我有以下HTML：用于显示这一点的应用程序知道如何处理和.语句。因此，当我简单地用jsoup解析文本时，<和>被编码，html被重新组织，所以它不能正确地执行或显示。例如：我的最终目标是添加一些css和js包含，并修改几个元素属性。那真的不是问题，我已经解决了那么多了。问题是我不知道如何保留非HTML元素，并将格式与原始格式
使用jsoup获取具有类的div元素

我是Jsoup解析的新手，我想获得这个页面上所有公司的列表：https://angel.co/companies?company_types[]=startup现在，一种实现这一点的方法实际上是使用与我需要的相关的div标记来检查页面。但是，当我调用该方法时：首先，我甚至无法在我的consol html输出中找到那些DIV标记（这些标记应该给出公司的列表）；其次，即使我找到了它，我如何才能找到具
使用Jsoup提取HTML

我一直在研究用于数据提取的Jsoup示例，并提取了此链接的一个示例 J汤

使用jSoup获取内部html和当前元素html

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档