当前位置: 首页 > 面试题库 >

如果类“包含”或正则表达式很漂亮?

陆浩博
2023-03-14
问题内容

如果我的班级名称经常不同,请说:

listing-col-line-3-11 dpt 41
listing-col-block-1-22 dpt 41
listing-col-line-4-13 CWK 12

通常我可以这样做:

for EachPart in soup.find_all("div", {"class" : "ClassNamesHere"}):
            print EachPart.get_text()

这里有太多的类名称无法使用,因此一类都已淘汰。

我知道Python没有我通常会使用的“ .contains”,但确实有一个“ in”。尽管我还没有找到一种方法来整合它。

我希望有一种使用正则表达式的方法。尽管我的Python语法确实让我失望,但我一直在尝试以下方面的变体:

regex = re.compile('.*listing-col-.*')
    for EachPart in soup.find_all(regex):

但这似乎并不能解决问题。


问题答案:

BeautifulSoup支持CSS选择器,您可以根据特定属性的内容选择元素。这包括*=用于包含的选择器。

以下将返回div具有class包含文本“ listing-col-”的属性的所有元素:

for EachPart in soup.select('div[class*="listing-col-"]'):
    print EachPart.get_text()


 类似资料:
  • 我需要一些“包含”和“不包含”的正则表达式。通常我会写: 包含:(.*WORD_A.*)$,不包含:(^((?!WORD_A.*)*)$ 如果单独使用,这很好,但我想写一些可以检测到的东西,比如“包含单词A和单词B”(顺序不相关!)和“包含单词A,但不包含单词B)。 基本上,我希望用户可以做出这样的声明“以单词a开头,包含单词B,但不是C和/或以D结尾”,程序返回真/假。最好的办法是只附加正则表达

  • 问题内容: 我有此RequestMapping: 我想添加该RequestMapping: 因此,它可以服务于所有“无出发”路线。但是,这会产生冲突,因为“ / route / to-destination-from-departure” URL实际上也与第二个RequestMapping匹配…很公平,所以我的解决方案是指定一个正则表达式: 因此,如果“目标”包含“ -from-”,则Reques

  • 我发现正则表达式不包含101,如下所示: 0*1*0*(1 00 000)*(010)* 我无法理解作者是如何想出这个正则表达式的。所以我只想到了不包含101的字符串: 01000100 我似乎上面的字符串不会与上面的正则表达式匹配。但我不确定。所以尝试在regex101.com上翻译成等效的pcre正则表达式,但也失败了(因为可以看到我的正则表达式甚至不匹配包含单个1的字符串。 我的翻译有什么问

  • 我试图从用#字符分隔的字符串中提取一个简单的句子。 有了这个模式 现在,有趣的是,当字符串包含换行符时,正则表达式不匹配 但是如果我从字符串中删除\n,它可以正常工作。知道如何解决这个问题吗?

  • 问题内容: 我有一个这样的正则表达式: 如果单词包含 bar , baz 或 bad ,则函数必须返回True 。简而言之,我需要python的regexp模拟 我怎么知道呢?谢谢! 问题答案:

  • 我在创建Django URL正则表达式时遇到问题,该正则表达式允许所有字符(包括正斜杠)。更具体地说,我遇到的问题是区分URL参数中使用的正斜杠和URL中用作分隔符的正斜杠。 例如: 我有一个URL,看起来像这样:localhost:8000/jfe/customer/customerNumb/invoice2/portfolio/ 这包括3个URL参数:customerNumb、invoice2