import requests
from bs4 import BeautifulSoup
r = requests.get(url)
soup = BeautifulSoup(r.content, 'lxml')
image = soup.select_one('#productImage > li > a > span > img')
print(image)
<img alt="Image" src="https://cdn.cloudflare.com/image.jpg" title="Image"/>
我想这样打印:
https://cdn.cloudflare.com/image.jpg
谢谢你们的回答伙计们
HTML:
<span class="imgInner">
<img src="https://cdn.cloudflare.com/image.jpg" alt="image" title="image">
</span>
试试这个。你可以点击这个帖子。
soup = BeautifulSoup("""<span class="imgInner">
<img src="https://cdn.cloudflare.com/image.jpg" alt="image" title="image">
</span>""", 'lxml')
image = soup.select_one('span.imgInner img')['src']
print(image)
废弃链接应该是一个简单的壮举,通常只需获取a标签的< code>src值。 我最近偶然发现这个网站(https://sunteccity.com.sg/promotions ),每个项目的a标签的href值无法找到,但重定向仍然有效。我正在试图找出一种方法来抓取项目及其相应的链接。我的典型python selenium代码如下所示 但是,我似乎无法检索任何、属性,我想知道这是否可能。我注意到我也无
问题内容: 我是新手,我的项目需要pySerial和feedparser模块。我在跑美洲狮。 我遵循了以下教程,以便可以升级到python 2.7.3,然后使用上述模块。 http://hackercodex.com/guide/python-virtualenv-on-mac-osx-mountain- lion-10.8/ 我按照本教程进行操作,直到安装了pip。而不是安装Virtualenv
问题内容: Python中确定两个范围中的哪些值重叠的最佳方法是什么? 例如: 给定一个范围x,迭代另一个范围y并输出两个范围共享的所有值的最佳方法是什么?先谢谢您的帮助。 编辑: 作为后续,我意识到我还需要知道x是否与y重叠。我正在寻找一种方法来遍历范围列表,并做一些范围重叠的其他事情。是否有简单的True / False语句来完成此操作? 问题答案: 尝试设置交集: 请注意,接受任何可迭代的参
我曾尝试在Python中查找立方根,但不知道如何找到它。有一行代码有效,但他不给我完整的数字。例子: 这不是给我4强硬,而是3.99999。有人知道我该怎么解决这个问题吗?
问题内容: 假设您要将一堆文件保存在某个地方,例如在BLOB中。假设您想通过网页分发这些文件,并让客户端自动打开正确的应用程序/查看器。 假设:浏览器通过HTTP响应中的mime-type(content-type?)标头找出要使用的应用程序/查看器。 基于此假设,除了文件的字节外,您还希望保存MIME类型。 您将如何找到文件的MIME类型?我目前在Mac上,但是在Windows上也应该可以使用。
请告诉我如何在数据帧中查找列的值 在@Dadep的答案中,链接给出了正确的答案