Jsoup 获取HTML
精华
小牛编辑
164浏览
2023-03-14
以下示例将展示在将 HTML 字符串解析为 Document 对象后获取内部 html 和外部 html 的方法的使用。
Jsoup 获取HTML 语法
Document document = Jsoup.parse(html);
Element link = document.select("a").first();
System.out.println("Outer HTML: " + link.outerHtml());
System.out.println("Inner HTML: " + link.html());
-
document :文档对象代表 HTML DOM。
-
Jsoup : 解析给定 HTML 字符串的主类。
-
html : HTML 字符串。
-
link : 元素对象表示表示锚标记的 html 节点元素。
-
link.outerHtml() : outerHtml() 方法检索元素完整的 html。
-
link.html() : html() 方法检索元素内部 html。
Jsoup 获取HTML 说明
Element 对象代表一个 dom 元素,并提供各种方法来获取 dom 元素的 html。
Jsoup 获取HTML 示例
package cn.xnip;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class JsoupTester {
public static void main(String[] args) {
String html = "<html><head><title>Sample Title</title></head>"
+ "<body>"
+ "<p>Sample Content</p>"
+ "<div id='sampleDiv'><a href='www.xnip.cn'>小牛知识库网</a>"
+ "<h3><a>Sample</a><h3>"
+"</div>"
+"</body></html>";
Document document = Jsoup.parse(html);
//a with href
Element link = document.select("a").first();
System.out.println("Outer HTML: " + link.outerHtml());
System.out.println("Inner HTML: " + link.html());
}
}
输出结果为: