当前位置: 首页 > 教程 > Jsoup >

Jsoup 获取URL路径

精华
小牛编辑
164浏览
2023-03-14

以下示例将展示可以提供 html 页面中存在的相对和绝对 URL 的方法。

Jsoup 获取URL路径 语法

String url = "https://www.xnip.cn/";
Document document = Jsoup.connect(url).get();
Element link = document.select("a").first();         

System.out.println("Relative Link: " + link.attr("href"));
System.out.println("Absolute Link: " + link.attr("abs:href"));
System.out.println("Absolute Link: " + link.absUrl("href"));
  • document : 文档对象代表 HTML DOM。

  • Jsoup : 连接到 url 并获取 html 内容的主类。

  • link : 元素对象表示表示锚标记的 html 节点元素。

  • link.attr("href") : 提供锚标记中存在的 href 值。它可以是相对的,也可以是绝对的。

  • link.attr("abs:href") : 在针对文档的基本 URI 进行解析后提供绝对 url。

  • link.absUrl("href") : 在针对文档的基本 URI 进行解析后提供绝对 url。

Jsoup 获取URL路径 说明

Element 对象代表一个 dom elment,并提供获取 html 页面中存在的相对和绝对 URL 的方法。

Jsoup 获取URL路径 示例

package cn.xnip;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

import java.io.IOException;

public class JsoupTester {
   public static void main(String[] args) throws IOException {
   
      String url = "https://www.xnip.cn/";
      Document document = Jsoup.connect(url).get();

      Element link = document.select("a").first();
      System.out.println("Relative Link: " + link.attr("href"));
      System.out.println("Absolute Link: " + link.attr("abs:href"));
      System.out.println("Absolute Link: " + link.absUrl("href"));
   }
}

输出结果为: