当前位置: 首页 > 知识库问答 >
问题:

从span标签android jsoup获取数据

葛昱
2023-03-14

我想从URL示例中获取一个图像博客头像:https://soundcloud.com/topsify

<span style="background-image: url(&quot;https://i1.sndcdn.com/avatars-000132054558-5ra8gl-t500x500.jpg&quot;); width: 200px; height: 200px; opacity: 1;" class="sc-artwork sc-artwork-placeholder-8 image__rounded image__full g-opacity-transition" aria-label="Topsify’s avatar" aria-role="img"></span>

我试图得到:

document = Jsoup.connect("https://soundcloud.com/topsify").get();
Elements imgElement = document.select("span[style*=background-image:]");

但它还是空的。请支持获取头像url:https://i1.sndcdn.com/avatars-000132054558-5ra8gl-t500x500.jpg谢谢

共有1个答案

郦楷
2023-03-14

尝试使用userAgentString。下面的代码只是示例,您可以使用element.select()

检查页面的查看源。这是img标签,不是span标签

    String url = "https://soundcloud.com/topsify";
    Response res = Jsoup.connect(url).userAgent("Mozilla/5.0 (Windows NT 6.3; Trident/7.0; rv:11.0) like Gecko").timeout(3000).execute();
    Document document = res.parse();
    //get <img> tags
    for (Element img : document.getElementsByTag("img")) {
    Elements avatars;
    //get src attribute value whose has "avatars"
    if((avatars = img.getElementsByAttributeValueMatching("src", "avatars")) !=null){
     System.out.println(avatars.attr("src"));
    }             
 }

 类似资料:
  • 问题内容: 有人可以告诉我未指定a 或元素的&位置吗? 即: 在上面,如果我这样做: 返回的值。但是,如果我尝试将其用于“ 12a”,则不会返回任何内容。 我在页面上有一堆/ s,我无法为其指定/ 属性,但是我需要在该元素的正下方显示一个。 问题答案: 此函数将告诉您元素相对于页面的x,y位置。基本上,您必须遍历所有元素的父级并将其偏移量加在一起。 但是,如果您只是想要元素相对于其容器的x,y位置

  • 问题内容: 我的链接看起来像这样 我想从那里去。我试过了 它输出。 我试过了,但它给了我KeyError。我该如何解决?我的错误是什么? 问题答案: 您可以使用css选择器,使用标题文本拉出所需的跨度: 找到具有包含 RAM 的 title 属性的 跨度 ,等效于在python中说。 或在 re.compile中 使用 find __ 要获取所有数据: 这会给你:

  • 我正在尝试刮网页,在那里我需要解码整个表到一个数据帧。我正为此使用漂亮的汤。在某些标记中,有一些标记没有任何文本。但这些值会显示在网页上的特定span标记中。 下面的代码对应于该网页, 但是,这个标记中显示的值是。我试着删掉它,但我收到的是空短信。 如何刮这个价值使用美丽的汤。 URL:https://en.tutiempo.net/climate/ws-432950.html 下面给出了我的用于

  • get标签 标签: <get></get> 作用:特殊标签,SQL查询标签 用法示例A: <get sql="SELECT * FROM cms_article WHERE status=99 ORDER BY inputtime DESC" page="$page" num="5"> .. HTML ..</get> 用法示例B: <get table="article" status="

  • 我们这里有一个传统的远程系统,没有webapi、webservice 然后我们需要通过Selenium进行集成 我们需要从一个主选项卡打开多个选项卡来进行提取,但当更改为所需选项卡并通过css选择器获取值时,它总是从第一个选项卡获得结果<我们的系统不能在互联网上打开,然后我以谷歌为例做了同样的事情,同样的行为也发生了。是虫子还是我的错?有人能看出什么是错的吗 下面是一个没有错误检查的简化版本,它的

  • 我正在尝试使用Python和Selenium获取此元素。 这就是我所尝试的: 我做错了什么?