当前位置：首页 > 面试题库 >

使用jsoup解析html并删除标记块

魏臻

2023-03-14

问题内容：

我想删除标签之间的所有内容。输入示例可能是

输入：

<body>
  start
  <div>
    delete from below
    <div class="XYZ">
      first div having this class
      <div>
        waste
      </div>
      <div class="XYZ">
        second div having this class
      </div>
      waste
    </div>
    delete till above
  </div>
  <div>
    this will also remain
  </div>
  end
</body>

输出将是：

<body>
  start
  <div>
    delete from below
    delete till above
  </div>
  <div>
    this will also remain
  </div>
  end
</body>

基本上，我必须先删除整个区块 <div class="XYZ">

谢谢，

问题答案：

您最好对找到的所有元素进行迭代。所以你可以保证

a。）所有元素都被删除并且
b。）如果没有元素，那么什么也做不了。

例：

Document doc = ...

for( Element element : doc.select("div.XYZ") )
{
    element.remove();
}

编辑：

（除了我的评论）

当简单的 null /范围检查 在这里足够时，请不要使用异常处理：

doc.select("div.XYZ").first().remove();

代替：

Elements divs = doc.select("div.XYZ");

if( !divs.isEmpty() )
{
    /*
     * Here it's safe to call 'first()' since there at least one element.
     */
}

类似资料：

Jsoup只删除html标记

什么是正确的方法来删除只有HTML标签（保留所有自定义/未知的标签）与JSOUP（不是正则表达式）？预期输入：预期产出：我尝试使用白名单清洁剂。none（），但它也会删除自定义标记。我也尝试过：但是它也删除了自定义标签。这个答案对我不好，因为自定义标记的数量是无限的。
使用Jsoup解析HTML div标记

我试图从这些div标签中获取文本，但是它们都不返回任何内容: HTML: 我想得到div类“消息”和h4标记和跨越“日期时间”中的文本，我试图：和：但是他们没有成功。
JSoup-逐标记解析HTML标记

我实际上正在用Java开发一个文本解析器，有人要求我通过用它解析HTML来增强它。解析器的目的是将被解析的文件分成另外三个文件，一个包含文件中包含的所有单词，一个包括所有句子，另一个包含所有问题。 *.txt部分工作得很好，但我在解析HTML时遇到了一个问题。我创建了一个扩展名为*.txt的临时文件，并将其在我的文本解析器中传递，但是如果我传递一个带有HTML文件链接的URL，其格式如下所示：
使用JSoup仅删除HTML标记，而不删除“”标记中的数据

我使用JSoup解析字符串，其中包含超文本标记语言标记为纯文本。例如：它可以很好地解析它，但问题是我的Java字符串是否包含
使用Jsoup在保留内部HTML的同时解析和删除锚标记

我必须解析一些html并移除锚标记，但我需要保留锚标记的innerHTML 例如，如果我的html文本是：现在我可以解析上面的html并在jsoup中选择如下所示的标记, 我可以通过，但是它会从开始括号到结束括号删除完整的achor标记，并且内部html会丢失，如何才能保留只删除开始和结束标记的内部html。另外，请注意：我知道有从元素中获取outerHTML（）和innerHTML（）的方
使用 Jsoup 解析 dl 标记

我正在尝试解析

相关阅读

JSoup使用未关闭的标签解析无效的HTML 如何在Java中删除HTML标记 Android使用Jsoup解析Html表格的方法 Jsoup-仅保留标签并删除所有文本 TagSoup，Jsoup，HTML解析器，HotSax和

相关文章

Jsoup 设置HTML Jsoup 获取HTML Cassandra删除数据记录 Jsoup 读取URL获取HTML Jsoup 读取文件获取HTML

相关问答

使用 Jsoup 解析 dl 标记使用JSoup解析HTML 使用jsoup替换HTML标记在 Java 中使用 JSoup 从 HTML 中解析标记数据如何使用JSOUP解析HTML表？

相关工具

解析html网页的数据标准TVL格式数据解析 jsoup IOS中解析并显示Gif文件 ini格式解析

相关文档

Jsoup 学习笔记 HTML 学习笔记 Jsoup 中文文档 JSoup 中文教程深入解析 Go