Jsoup 解析HTML正文

精华

小牛编辑

157浏览

2023-03-14

以下示例将展示将 HTML 片段字符串解析为 Element 对象作为 html 正文。

Jsoup 解析HTML正文语法

Document document = Jsoup.parseBodyFragment(html);
Element body = document.body();

document ：文档对象代表 HTML DOM。
Jsoup ：解析给定 HTML 字符串的主类。
html ： HTML 片段字符串。
body ：表示文档正文元素的子元素，等效于 document.getElementsByTag("body")。

Jsoup 解析HTML正文说明

parseBodyFragment(String html) 方法将输入的 HTML 解析为一个新的 Document。该文档对象可用于遍历和获取 html body 片段的详细信息。

Jsoup 解析HTML正文示例

package cn.xnip;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class JsoupTester {
   public static void main(String[] args) {
   
      String html = "<div><p>小牛知识库网：Sample Content</p>";
      Document document = Jsoup.parseBodyFragment(html);
      Element body = document.body();
      Elements paragraphs = body.getElementsByTag("p");
      for (Element paragraph : paragraphs) {
         System.out.println(paragraph.text());
      }
   }
}

输出结果为：

Jsoup 解析HTML正文

Jsoup 解析HTML正文 语法

Jsoup 解析HTML正文 说明

Jsoup 解析HTML正文 示例

Jsoup 解析HTML正文语法

Jsoup 解析HTML正文说明

Jsoup 解析HTML正文示例