当前位置: 首页 > 知识库问答 >
问题:

使用jSoup获取内部html和当前元素html

益英逸
2023-03-14

我有以下相同的代码....

<a id="rowID5" class="title-link">
 <div id="rowData">
  <div>Some text here</div>
 </div>
</a>

现在我必须使用以下代码对“a”元素执行select...

Document doc = Jsoup.parse(htmlData);
Elements row = doc.select("a.title-link");

现在当我做下面的...

for (int i = 0; i < row.size(); i++){
 String foo = row.get(i).html();
 break; //I break here only for Testing Purposes there will be more rows eventually
}

当然,问题是当“foo”返回时,它等于...

 <div id="rowData">
  <div>Some text </div>
 </div>

我需要“foo”来等于原来的…

<a id="rowID5" class="title-link">
 <div id="rowData">
  <div>Some text here</div>
 </div>
</a>

我之所以做这些,是因为我在文档上做了一个select以返回元素的内部html。然后,我的代码从元素中提取数据并执行操作(创建foo字符串的地方),然后我需要使用完整的html(包括A tag元素及其子元素)并将其设置为“foo”作为输出。

共有1个答案

拓拔阎宝
2023-03-14

node.outerHTML()可以完成您所要查找的内容。

 类似资料:
  • 主要内容:Jsoup 获取HTML 语法,Jsoup 获取HTML 说明,Jsoup 获取HTML 示例以下示例将展示在将 HTML 字符串解析为 Document 对象后获取内部 html 和外部 html 的方法的使用。 Jsoup 获取HTML 语法 document :文档对象代表 HTML DOM。 Jsoup : 解析给定 HTML 字符串的主类。 html : HTML 字符串。 link : 元素对象表示表示锚标记的 html 节点元素。 link.outerHtml() : o

  • 我正在刮网页使用JSoup库通过选择类属性,其中包含"nav"字符串。 这是获取网站超文本标记语言的代码: 正如您所看到的,id=“varPreviewMenu”的ul元素包含Jsoup检索到的HTML不包含的li元素。 我怎样才能得到那些元素?

  • 我是jsoup的新手,在使用非HTML元素(脚本)时遇到了一些困难。我有以下HTML: 用于显示这一点的应用程序知道如何处理 和.语句。因此,当我简单地用jsoup解析文本时,<和>被编码,html被重新组织,所以它不能正确地执行或显示。例如: 我的最终目标是添加一些css和js包含,并修改几个元素属性。那真的不是问题,我已经解决了那么多了。问题是我不知道如何保留非HTML元素,并将格式与原始格式

  • 我是Jsoup解析的新手,我想获得这个页面上所有公司的列表:https://angel.co/companies?company_types[]=startup现在,一种实现这一点的方法实际上是使用与我需要的相关的div标记来检查页面。但是,当我调用该方法时: 首先,我甚至无法在我的consol html输出中找到那些DIV标记(这些标记应该给出公司的列表);其次,即使我找到了它,我如何才能找到具

  • 我一直在研究用于数据提取的Jsoup示例,并提取了此链接的一个示例 J汤