当前位置: 首页 > 知识库问答 >
问题:

Java jsoup链接提取

陆雨华
2023-03-14

我试图提取JSOUP中给定元素中的链接。这里我做了什么但它不起作用:

   Document doc = Jsoup.connect(url).get();
        Elements element = doc.select("section.row");
        Element s = element.first();
        Elements se = s.getElementsByTag("article");


            for(Element link : se){
                System.out.println("link :" + link.select("href"));
            }

我正在尝试做的事情是获得所有的链接与文章类。我想,也许首先我必须选择section class=“row”,然后从article类派生链接,但我无法使其工作。

共有1个答案

夹谷晋
2023-03-14

试试这个。

Document doc = Jsoup.connect(url).get();      

    Elements section = doc.select("#main"); //select section with the id = main
    Elements allArtTags = section.select("article"); // select all article tags in that section
    for (Element artTag : allArtTags ){
        Elements atags = artTag.select("a"); //select all a tags in each article tag
        for(Element atag : atags){
            System.out.println(atag.text()); //print the link text or 
            System.out.println(atag.attr("href"));//print link
        }
    }
 类似资料:
  • 问题内容: 使用Java,如何从给定的网页中提取所有链接? 问题答案: 将Java文件下载为纯文本/ html格式,并通过Jsoup或 html clean传递,两者相似,甚至可以用于解析格式错误的html 4.0语法,然后可以使用流行的HTML DOM解析方法,例如getElementsByName(“ a”)或在jsoup中它甚至很酷,您只需使用 并找到所有链接,然后使用 取自http://j

  • 本文向大家介绍Jsoup 提取URL和链接标题,包括了Jsoup 提取URL和链接标题的使用技巧和注意事项,需要的朋友参考一下 示例 Jsoup可用于轻松地从网页中提取所有链接。在这种情况下,我们可以使用Jsoup提取我们想要的特定链接,这里h3是页面标题中的链接。我们还可以获取链接的文本。 这给出以下输出: 这里发生了什么事: 首先,我们从指定的URL获取HTML文档。此代码还将请求的用户代理标

  • 问题内容: 我的目标是在从链接读取href属性时始终获取相同的字符串(在我的情况下为URI)。举例:假设认为,一个HTML文件,它有一个像somany链接 ,但基本域是http://www.domainname.com/index.html 但基本域是http://www.domainname.com/dit/index.html 如何我可以正确获取所有链接意味着完整链接包括域名吗? 我如何在Ja

  • 使用这个站点上的另一个答案,我可以找到这个curl脚本: 它能够下载大型谷歌驱动器文件(显示警告页面)。 此外,我还可以使用命令: 那么,我怎样才能简单地返回直接的Google Drive下载链接,而不是下载整个东西呢? 编辑:

  • 当我们共享这样的链接时,我们如何在我们的网站中包含一个图像来显示在WhatsApp中?

  • Markdown 支持两种形式的链接语法: 行内式和参考式两种形式。 不管是哪一种,链接文字都是用 [方括号] 来标记。 要建立一个行内式的链接,只要在方块括号后面紧接着圆括号并插入网址链接即可,如果你还想要加上链接的 title 文字,只要在网址后面,用双引号把 title 文字包起来即可,例如: This is [an example](http://example.com/ "Title")