当前位置: 首页 > 知识库问答 >
问题:

使用正则表达式查找并从img标记中获取值,img标记是另一个标记的成员

章阳波
2023-03-14

我有来自网站的代码,我想在那里找到并获得图像的路径,我的意思是来自src的值,在img标签中。问题的核心是标记之间的图像路径:wphimage和带有的图像。jpg扩展。

代码下方:

<p>
    <wphimage data="{'Copyright':'John Smith','Alignment':'left','ImageVersion':'conductorportraitlong'}">
    <span style="display:block; float:left;" class="DIV_imageWrapper">
        <a data-lightview-title="John Smith"  class="lightview" href="//path/to/image/web.jpg"">
            <img src="//path/to/image/web.jpg" alt="Name">
        </a>
        <a class="A_copyright" href="javascript:;">©&nbsp; <span>Terry Linke</span></a>
        <a href="javascript:;">≡ <span>John Smith</span></a>| 
        <a class="A_zoom lightview" href="//path/to/image/web.jpg" data-lightview-title="Dietfried Gürtler" data-lightview-caption="Terry Linke">+ </a>
    </span>
    </wphimage>

    Text here...
</p>

我尝试了:

wphimage = re.findall(r'\S+\.jpg', text)

但我也得到了另一个值,来自不同的标签,然后<代码>


共有1个答案

燕成双
2023-03-14

你可以试试

wphimage = re.findall(r'<img.*src=\"(\S*|\w*)\"', txt)

输出

['//path/to/image/web.jpg']

这个正则表达式在img标记src值中获取任何介于“”之间的非空格和任何文字字符。

 类似资料:
  • 我有许多大的SVG文件(用在线工具减小大小后大约有200kb)。我真的不希望访问者每次访问时都从我的服务器上下载所有的文本。我想利用CDN和varnish缓存。 如果我使用SVG标签,浏览器、CDN或Varish都会将svg代码缓存在html文档中。SVG没有src属性。 如果我使用图像标记,它将被缓存,但我无法利用SVG标记的preserveAspectRatio和viewBox。在调整浏览器窗

  • 我做了一个画廊,包含一些不同的图像和点击他们打开模态,并显示图像的缩放。 我使用相同的方法与投资组合,但在这里我只有4项,所以我创建4种不同的模态,显示描述等... 现在有了图像,我想要一个单一的模式,改变图像显示与用户点击。 包含图像的div是这样结构的: 这里是模态: 这里是jQuery: 以下链接 问题是,当我点击图片时,网站显示模式,但不显示里面的图片。。。使用inspect代码,我看到s

  • 问题内容: 我正在寻找一个正则表达式,可以从Java中的HTML片段中获取src(不区分大小写)标签。 问题答案: 一种可能性: 是可能的(如果不区分大小写地匹配)。这有点混乱,故意忽略了不使用引号的情况。要表示它而不必担心字符串转义: 这符合: 一个或多个不是的字符(即可能的其他属性) 可选空格 可选空格 或的起始定界符 图片来源 (可能不包含单引号或双引号) 结束定界符 尽管表达式可以在此处停

  • 我有一根绳子,看起来像这样:

  • 我想验证输入的代码是否是HTML代码(必须以<代码> 我试着这么做 但是我有一个问题需要在代码中做一个\n,我需要验证第一个和结束标签(=

  • 我有以下超文本标记语言片段: 有2个IMG标签,然后是ID标签。我正在尝试定位第一个IMG标签。我想从使用XPATH的ID标记开始。 我的XPath正在查找两个IMG标记。我只想要第一个IMG标签。我的XPath是: 如何使用祖先定位第一个IMG标签,因为我想从ID标签开始?