当前位置: 首页 > 知识库问答 >
问题:

如何获得图像。div的losts级别中的src标记

段干兴业
2023-03-14

我打电话给Jsoup。连接(url)。获取一个http文档。我也打电话给医生。选择(“img[src]”,但返回空。现在我发现了问题所在。对于某些div,标记不是静态的。它们是动态生成的。当一些ajax帖子完成时。div tags标记已写入正文。在“doc=Jsoup.connect(url.get()”之后的文档中不存在以下div标记。

<div class="w clear con-page">
    <div class="article_nav" >
        <a href="index.html">Home</a>&nbsp;&gt;&nbsp;<a href="list.html">car size rate </a>&gt;&nbsp; 
    </div>
    <div id="article_content" class="article article_content" style="min-height: 400px;">
        <div class="article_title"> <p>ARTICLE:2021-04-09</div>
        <div class="article_main" align="center">
            <p ><img width="600" title="1617952699745078083.jpg" alt="1617952602(1).jpg" src="http://www.chinaisa.org.cn/gxportalFile/image/2021/04/09/1617952699745078083.jpg"></p>
        </div>
    </div>
</div>

我想通过Jsoup从html页面获取所有图像src。现在我面临一个问题,医生。选择(“img”)不返回任何内容。我猜img标签在下面。Jsoup可以使用xpath获取img。是否有任何方法获取所有img标签?

div(w clear con-page)
--div(article_content)
  --div(article_main)
    --p
      --img

共有1个答案

范稳
2023-03-14

它对我有用。

    String html = "<div class=\"w clear con-page\">\r\n"
        + "    <div class=\"article_nav\" >\r\n"
        + "        <a href=\"index.html\">Home</a>&nbsp;&gt;&nbsp;<a href=\"list.html\">car size rate </a>&gt;&nbsp; \r\n"
        + "    </div>\r\n"
        + "    <div id=\"article_content\" class=\"article article_content\" style=\"min-height: 400px;\">\r\n"
        + "        <div class=\"article_title\"> <p>ARTICLE:2021-04-09</div>\r\n"
        + "        <div class=\"article_main\" align=\"center\">\r\n"
        + "            <p ><img width=\"600\" title=\"1617952699745078083.jpg\" alt=\"1617952602(1).jpg\" src=\"http://www.chinaisa.org.cn/gxportalFile/image/2021/04/09/1617952699745078083.jpg\"></p>\r\n"
        + "        </div>\r\n"
        + "    </div>\r\n"
        + "</div>";
    Document doc = Jsoup.parse(html);
    Elements es = doc.select("img[src]");
    for (Element e : es)
        System.out.println(e.attr("src"));

输出:

http://www.chinaisa.org.cn/gxportalFile/image/2021/04/09/1617952699745078083.jpg
 类似资料:
  • 给定一个实现为根节点的泛型树,该根节点具有子节点列表,子节点是节点,并且每个节点都具有其子节点列表。 节点具有其子节点的列表: 也有他们儿子的名单:;;; 我将解释我的算法的想法,你可以修复它或给我另一个全新的想法。 遍历树,将树的每个节点添加到队列中,或者如果添加的最后一个节点是级别的最后一个节点,则添加一个“null”。Null是队列中的标识符,用于知道级别已结束的位置。我的问题是,我不知道第

  • 我做了一个画廊,包含一些不同的图像和点击他们打开模态,并显示图像的缩放。 我使用相同的方法与投资组合,但在这里我只有4项,所以我创建4种不同的模态,显示描述等... 现在有了图像,我想要一个单一的模式,改变图像显示与用户点击。 包含图像的div是这样结构的: 这里是模态: 这里是jQuery: 以下链接 问题是,当我点击图片时,网站显示模式,但不显示里面的图片。。。使用inspect代码,我看到s

  • 我有一个docker(带有dockerfile),它是从带有not标记的基本docker构建的(这意味着它是最新的标记)。 docker是一年前构建的,我想知道我们使用的是哪个标签(版本)。

  • 我希望当我点击按钮时,我可以得到具体的img src,并在div classblock中显示img src。 HTML CSS JS 但是现在我面临的问题是获取img src。 所以我使用alert进行测试,结果是它什么都没有。

  • 我使用下面的代码来捕获人脸使用Haar级联分类器,但仍然没有得到完整的头部图像