当前位置: 首页 > 知识库问答 >
问题:

Android使用Jsoup从html文本中删除第一个和最后一个标记

常温文
2023-03-14

我想从html文本中删除第一个和最后一个div标签。我使用jSoup库来解析html文本。我尝试了一些在代码中显示的东西。有多个div标签的html文本,或者没有,但是我想删除第一个和最后一个div标签,如果有的话。

 public String divremove(String html) {
    Document doc = Jsoup.parse(html);

    for (Element e : doc.select("div")){
        if (e != null) {
            Log.e("LOG","link  >> " + e.text());
        }
    }
/*  Element link = doc.removeClass("div");
    if (link != null) 
    {
    }
    Integer in = doc.select("div").first().elementSiblingIndex();*/

    Element link = doc.select("div").first();
    Log.e("LOG","link  >> " + link);
    Element link2 = doc.select("div").last();
    Log.e("LOG","link2  >> " + link2.text());
    return html;//formatted
}

共有1个答案

宣原
2023-03-14

这里有一个例子:

final String html = "<div>A</div><div>B</div><div>C</div><div>D</div>";
Document doc = Jsoup.parse(html);


// (1) - Remove from html
doc.select("div").first().remove();
doc.select("div").last().remove();

System.out.println(doc.body());


// (2) - Remove from list
Elements divs = doc.select("div");
divs.remove(0);
divs.remove(divs.size()-1);

System.out.println(divs);

(1)从html中删除第一个和最后一个标记,因此doc不再包含它们。如果您只是想从您选择的div中删除它们,请改为使用(2)。这将把它保存在你的html(=doc)中,但是它已经从div中删除了。

 类似资料:
  • 问题内容: 我已经在SOAP消息中工作过,以从Web服务获取LoginToken,并将LoginToken存储在String中并用于打印。此打印[wdsd34svdf],但我只想wdsd34svdf,如何删除方括号。请任何人帮助我。 谢谢 例: 输出:[wdsd34svdf]我想要wdsd34svdf 问题答案: 这很容易,您需要先找到[和]的索引,然后再找到子字符串。(这里[总是在开始处,]在结

  • 问题内容: 在互联网上浏览后,我来了。 假设我已经制作了一个文本文件,内容为: 好吧,我想从此文本文件中删除最后一个字符(在本例中为)。 因此,现在文本文件应如下所示: 但是我不知道该怎么做。 我所需要的或多或少是对HDD上文本文件的单个退格功能。 这需要在Linux上工作,因为这就是我正在使用的。 问题答案: 用于从末尾寻找1个位置,然后用于删除文件的其余部分: 这对于单字节编码工作正常。如果您

  • 什么是正确的方法来删除只有HTML标签(保留所有自定义/未知的标签)与JSOUP(不是正则表达式)? 预期输入: 预期产出: 我尝试使用白名单清洁剂。none(),但它也会删除自定义标记。 我也尝试过: 但是它也删除了自定义标签。 这个答案对我不好,因为自定义标记的数量是无限的。

  • 问题内容: 我必须将HTML中的所有文本元素提取到Java字符串中。但是在单独的字符串中。 我有以下代码: 我用: 但是与此同时,我提取了“ hide-for-small”类中的所有Strings。所以我得到的答案是:2. Spieltag | sa。,26.07.2014 | 17:45 Uhr 2. Spieltag 26.07.2014 17:45 Uhr Letzigrund | 4200

  • 问题内容: 从字符串中删除最后一个字符的最快方法是什么? 我有一个像 我想删除最后一个’,’并取回剩下的字符串: 最快的方法是什么? 问题答案: 首先,我尝试没有空格,并得到一个错误结果。 然后,我添加一个空格并获得良好的结果: