当前位置: 首页 > 教程 > Jsoup >

Jsoup 解析HTML正文

精华
小牛编辑
143浏览
2023-03-14

以下示例将展示将 HTML 片段字符串解析为 Element 对象作为 html 正文。

Jsoup 解析HTML正文 语法

Document document = Jsoup.parseBodyFragment(html);
Element body = document.body();
  • document : 文档对象代表 HTML DOM。

  • Jsoup : 解析给定 HTML 字符串的主类。

  • html : HTML 片段字符串。

  • body : 表示文档正文元素的子元素,等效于 document.getElementsByTag("body")。

Jsoup 解析HTML正文 说明

parseBodyFragment(String html) 方法将输入的 HTML 解析为一个新的 Document。该文档对象可用于遍历和获取 html body 片段的详细信息。

Jsoup 解析HTML正文 示例

package cn.xnip;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class JsoupTester {
   public static void main(String[] args) {
   
      String html = "<div><p>小牛知识库网:Sample Content</p>";
      Document document = Jsoup.parseBodyFragment(html);
      Element body = document.body();
      Elements paragraphs = body.getElementsByTag("p");
      for (Element paragraph : paragraphs) {
         System.out.println(paragraph.text());
      }
   }
}

输出结果为: