当前位置: 首页 > 面试题库 >

Python BeautifulSoup提供多个标签来查找全部

岳枫
2023-03-14
问题内容

我正在寻找一种使用findAll来获取两个标签的方式,按照它们在页面上出现的顺序。

目前我有:

import requests
import BeautifulSoup

def get_soup(url):
    request = requests.get(url)
    page = request.text
    soup = BeautifulSoup(page)
    get_tags = soup.findAll('hr' and 'strong')
    for each in get_tags:
        print each

如果我在仅带有’em’或’strong’的页面上使用该标签,则它将获得所有这些标签,如果我在同时使用这两个标签的页面上将获得’strong’标签

有没有办法做到这一点?我主要关心的是保留标签的查找顺序。


问题答案:

您可以传递一个list,以找到任何给定的标签:

tags = soup.find_all(['hr', 'strong'])


 类似资料:
  • 问题内容: 我正在使用基本上是时间序列的熊猫数据帧,如下所示: 我想要拥有的是level列的多个索引/标题,如下所示: 所以基本上我正在寻找类似的东西,,。 原因是一个位置可以有多个数据集,而我希望能够从一个合并的大数据框中选择一个位置的所有数据,或者所有位置的特定类型的所有数据。 我可以从pandas文档中设置一个示例数据框,并测试我的选择,但是对于我的真实数据,我需要像示例中那样以不同的方式设

  • 问题内容: 我遇到一个问题,当执行两个表的联接时,无法确定mysql查找具有两个特定“标签”和相同“ hashid”的链接 假设我的表看起来像这样: 链接 标签 我想返回同时具有“有用”和“很棒”标签的行 当前(工作/快速)查询,用于按1个标签查找链接: 阅读文章后,我尝试使用以下内容: 这 不 工作,但它是如此令人难以置信的缓慢,因为无法使用。 有人知道解决方案吗? 问题答案: 问题的类型称为

  • 问题内容: 我在HTML页面上有几个具有相同类的元素-但是它们是不同的元素类型。我想在遍历元素时找出元素的标签名称-但是.attr不会使用“标签”或“标签名称”。 这就是我的意思。考虑页面上的以下元素: 现在,我想运行类似的代码,以确保所有元素都具有一个ID(如果尚未定义): 我想要的结果是H2和H4元素的ID为 分别。 关于如何发现“ this”表示的元素的标签名称的任何想法? 问题答案: 应该

  • 问题内容: 我正在尝试查询与所有给定标记集匹配的对象。 基本上,我希望用户能够添加越来越多的标签来过滤或“缩小”其搜索结果,就像newegg.com一样。 我的表结构是一个对象表,一个标签表和一个MANY:MANY关系表ObjectsTags。所以我有一个像这样的JOIN查询: 我尝试使用IN子句/条件,如下所示: 但是我了解到,这模拟了一系列OR,因此您向查询中添加的标签越多,得到的结果就越多,

  • 下面是java代码: 这有帮助吗?我真的不知道了...

  • 我的问题是,我希望有两个身份验证提供商 之前:我有我的UserDetailServiceImpl,我根据数据库中的数据验证了用户的身份(不确定是哪个提供者) 现在:我使用了ActiveDirectoryLdapAuthentiation提供程序,如下所示 我成功了,所以我可以认证。 问题是: 我现在无法再使用数据库用户登录,现在只有LDAP。 未使用UserDetailsService,因此用户具