当前位置：首页 > 面试题库 >

Python 3-从beautifulSoup中的标签获取文本

荆运诚

2023-03-14

问题内容：

我正在使用beautifulSoup从网站提取数据。每当您重新加载页面时，该网站上的文本都会更改，因此基本上，我希望能够将重点放在类名上作为静态变量，因为文本是动态的。

import requests
from bs4 import BeautifulSoup
url = 'xxxxxxxxxxx'
r = requests.get(url)
soup = BeautifulSoup(r.content, 'html.parser')
class2 = soup.find_all(True, class_="template_title")
print (class2)

它打印出
<td align="left" class="template_title" height="50" valign="bottom" width="535"><div style="padding-bottom:9px;">4</div></td>
当页面重新加载，我仍然有重点的领域，但我不知道如何只打印文本（在这种情况下是：4）

一旦解决了这个问题，我还有另一个问题：如果该类包含多个标签，是否有办法获取更多静态数据，以确保它只打印我在搜索的文本，而不是其他文本？（我有课，但是我也可以使用height
=“ 50” valign =“ bottom” width =“ 535”吗？）

问题答案：

您可以使用text或string属性的元素。
```
elems = soup.find_all(True, class_='template_title')
```
print([elem.string for elem in elems])

根据需要指定更多属性：

elems = soup.find_all(True, class_='template_title',
                  height='50', valign='bottom', width='535')

类似资料：

如何从BeautifulSoup中的span标签获取文本

问题内容：我的链接看起来像这样我想从那里去。我试过了它输出。我试过了，但它给了我KeyError。我该如何解决？我的错误是什么？问题答案：您可以使用css选择器，使用标题文本拉出所需的跨度：找到具有包含 RAM 的 title 属性的跨度，等效于在python中说。或在 re.compile中使用 find __ 要获取所有数据：这会给你：
BeautifulSoup从find_all获取_文本

这是我第一次使用网页抓取。到目前为止，我能够导航并找到我想要的HTML部分。我也可以打印出来。问题是只打印文本，这不起作用。我在尝试时遇到以下错误：这是我的代码：
使用BeautifulSoup获取标签样式

问题内容：我正在抓取页面，并从该页面上的表中获取所有元素，如下所示：输出：现在，我试图获取标签的样式，但是我不知道如何。例如，如果我这样做：它显然只是打印东西。我想我大概可以做这样的事情，比如，但一切到目前为止，我已经尝试并没有带来我想要的东西。问题答案：只需使用以下属性即可访问：如果您只想要具有样式属性an的tr标记来获取全部标记：或使用CSS选择器：使用您的实际网址：
BeautifulSoup：从锚标记中提取文本

问题内容：我要提取：来自标签的src的文本和类数据内的定位标记的文本我成功地提取了img src，但是从锚标记中提取文本时遇到了麻烦。这是整个HTML页面的链接。这是我的代码：我想做的是提取图像src（链接）和中的标题，因此例如：应该提取：问题答案：以上所有答案确实可以帮助我构建答案，因此，我对其他用户提出的所有答案投了赞成票：但是我最终对自己正在处理的确切问题汇总了自己的答
BeautifulSoup：从定位标记中提取文本

我想摘录：图像标记和类数据内的锚标记文本我成功地提取了img src，但从锚标记中提取文本时遇到了问题。这是整个HTML页面的链接。这是我的代码：我试图做的是提取图像src（link）和div class=data中的标题，例如：应提取：尼康COOLPIX L26 16.1 MP数码相机，配备5倍变焦NIKKOR玻璃镜头和3英寸LCD（红色）
如何使用BeautifulSoup bs4获取HTML标签的内部文本值？

问题内容：使用BeautifulSoup bs4时，如何从HTML标签内部获取文本？当我运行此行时：我得到这样的标签：现在我只想获取其中的内部文本，不带标签。怎么做？问题答案：使用.text从标记中获取文本。要不就要打开文件并使用文本作为名称，请像使用其他任何字符串一样简单地使用它：

相关阅读

如何从标签中获取文本，但忽略其他子标签使用beautifulSoup，Python在h3和div标签中刮取文本如何从输入标签获取文本？Java Regex从HTML锚（…）标签获取文本 BeautifulSoup：从HTML获取CSS类

相关文章

YAML标量和标签 Bootstrap 标签页 MyBatis trim标签 MyBatis bind标签 MyBatis foreach标签

相关问答

如何使用BeautifulSoup和python从div标记中提取文本 Android/JSoup-从标签获取价值 Python BeautifulSoup：从div标记检索文本使用beautifulsoup从span标记中刮取数据获取范围标签的标题

相关工具

BeautifulSoup 标签云Demo Google地图JSP标签库 wechat-encrypt-python3 获取网页的所有图片

相关文档

KAG 标签文档 v1.0 C 标准库中文版 Go 语言标准库中文文档深入 Python3 Python 取证中文教程