Jsoup 解析HTML正文
精华
小牛编辑
143浏览
2023-03-14
以下示例将展示将 HTML 片段字符串解析为 Element 对象作为 html 正文。
Jsoup 解析HTML正文 语法
Document document = Jsoup.parseBodyFragment(html);
Element body = document.body();
-
document : 文档对象代表 HTML DOM。
-
Jsoup : 解析给定 HTML 字符串的主类。
-
html : HTML 片段字符串。
-
body : 表示文档正文元素的子元素,等效于 document.getElementsByTag("body")。
Jsoup 解析HTML正文 说明
parseBodyFragment(String html) 方法将输入的 HTML 解析为一个新的 Document。该文档对象可用于遍历和获取 html body 片段的详细信息。
Jsoup 解析HTML正文 示例
package cn.xnip;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class JsoupTester {
public static void main(String[] args) {
String html = "<div><p>小牛知识库网:Sample Content</p>";
Document document = Jsoup.parseBodyFragment(html);
Element body = document.body();
Elements paragraphs = body.getElementsByTag("p");
for (Element paragraph : paragraphs) {
System.out.println(paragraph.text());
}
}
}
输出结果为: