我想从URL示例中获取一个图像博客头像:https://soundcloud.com/topsify
<span style="background-image: url("https://i1.sndcdn.com/avatars-000132054558-5ra8gl-t500x500.jpg"); width: 200px; height: 200px; opacity: 1;" class="sc-artwork sc-artwork-placeholder-8 image__rounded image__full g-opacity-transition" aria-label="Topsify’s avatar" aria-role="img"></span>
我试图得到:
document = Jsoup.connect("https://soundcloud.com/topsify").get();
Elements imgElement = document.select("span[style*=background-image:]");
但它还是空的。请支持获取头像url:https://i1.sndcdn.com/avatars-000132054558-5ra8gl-t500x500.jpg谢谢
尝试使用userAgent
String。下面的代码只是示例,您可以使用element.select()
。
检查页面的查看源。这是img标签,不是span标签
String url = "https://soundcloud.com/topsify";
Response res = Jsoup.connect(url).userAgent("Mozilla/5.0 (Windows NT 6.3; Trident/7.0; rv:11.0) like Gecko").timeout(3000).execute();
Document document = res.parse();
//get <img> tags
for (Element img : document.getElementsByTag("img")) {
Elements avatars;
//get src attribute value whose has "avatars"
if((avatars = img.getElementsByAttributeValueMatching("src", "avatars")) !=null){
System.out.println(avatars.attr("src"));
}
}
问题内容: 有人可以告诉我未指定a 或元素的&位置吗? 即: 在上面,如果我这样做: 返回的值。但是,如果我尝试将其用于“ 12a”,则不会返回任何内容。 我在页面上有一堆/ s,我无法为其指定/ 属性,但是我需要在该元素的正下方显示一个。 问题答案: 此函数将告诉您元素相对于页面的x,y位置。基本上,您必须遍历所有元素的父级并将其偏移量加在一起。 但是,如果您只是想要元素相对于其容器的x,y位置
问题内容: 我的链接看起来像这样 我想从那里去。我试过了 它输出。 我试过了,但它给了我KeyError。我该如何解决?我的错误是什么? 问题答案: 您可以使用css选择器,使用标题文本拉出所需的跨度: 找到具有包含 RAM 的 title 属性的 跨度 ,等效于在python中说。 或在 re.compile中 使用 find __ 要获取所有数据: 这会给你:
我正在尝试刮网页,在那里我需要解码整个表到一个数据帧。我正为此使用漂亮的汤。在某些标记中,有一些标记没有任何文本。但这些值会显示在网页上的特定span标记中。 下面的代码对应于该网页, 但是,这个标记中显示的值是。我试着删掉它,但我收到的是空短信。 如何刮这个价值使用美丽的汤。 URL:https://en.tutiempo.net/climate/ws-432950.html 下面给出了我的用于
get标签 标签: <get></get> 作用:特殊标签,SQL查询标签 用法示例A: <get sql="SELECT * FROM cms_article WHERE status=99 ORDER BY inputtime DESC" page="$page" num="5"> .. HTML ..</get> 用法示例B: <get table="article" status="
我们这里有一个传统的远程系统,没有webapi、webservice 然后我们需要通过Selenium进行集成 我们需要从一个主选项卡打开多个选项卡来进行提取,但当更改为所需选项卡并通过css选择器获取值时,它总是从第一个选项卡获得结果<我们的系统不能在互联网上打开,然后我以谷歌为例做了同样的事情,同样的行为也发生了。是虫子还是我的错?有人能看出什么是错的吗 下面是一个没有错误检查的简化版本,它的
我正在尝试使用Python和Selenium获取此元素。 这就是我所尝试的: 我做错了什么?