当前位置：首页 > 面试题库 >

美丽的soup只是获得标签内的价值

苗森

2023-03-14

问题内容：

以下命令：

volume = soup.findAll("span", {"id": "volume"})[0]

给出：

<span class="gr_text1" id="volume">16,103.3</span>

当我发行印刷品（卷）时。

我如何获得电话号码？

问题答案：

从元素中提取字符串：

volume = soup.findAll("span", {"id": "volume"})[0].string

类似资料：

美丽的汤 - 从另一个标签内的标签中获取文本

我正在尝试使用漂亮的汤解析网页（这是我有生以来第一次），我遇到了一个奇怪的错误。html结构中的标记中有一个标记，我一直收到错误 html标签的结构如下：页面上项目的整个网格都在div类"properties_reviews"中，然后进入div类"preview"中，用于特定项目，该类"preview"还有两个类：照片的"preview-media"和我需要解析的文本信息的"preview-con
美丽的汤获得多页文本

我试图抓取德国聚会的新闻页面，并将所有信息存储在数据框中（“蟒蛇初学者”）。当我想将整个文本甚至日期存储到数据框中时，只存在一个小问题。似乎只有文本的最后一个元素（p... /p）将被存储在行中。我认为问题的出现是因为循环上的迭代是误导的。
使用美丽的汤解析< ul >标签

考虑一下这段代码：它只打印“divTag” 更新: 我基本上想在'a'标签中提取“字符串”值。
刮和循环元标签与美丽的汤

下面是一个网络刮刀，它用漂亮的汤从这个网站上刮出一个团队名单。每一列数据都被放入一个数组，然后循环到一个CSV文件中。我想刮掉团队名称（代码中的“团队”），但我正在努力将元标记（见下文的html代码）合并到我的CSV写入器循环中。我认为问题在于“Team”数组中的值长度与其他列中的值长度不匹配。例如，我当前的代码打印的数组如下所示：但我需要团队数组（最后一个数组）匹配前两个数组的长度，如下所示
在带有美丽汤的特定标签后获取文本

问题内容：我有一个像我可以得到标题标签但是我怎样才能在b标签之后得到文本呢？我想通过引用该元素而不是body元素来获取包含“ Title：”的元素之后的文本。问题答案：参考的文档，你可能想使用你的：在这种情况下，“同级”是下一个节点，而不是下一个元素/标签。元素的下一个节点是文本节点，因此您可以获得所需的文本。
从美丽汤标签中提取src

我试图使用美丽的汤抓取newegg的产品名称、描述、价格和图像。我有以下bs4.element.标签类型，我想从标签中提取“src”链接。以下是我的标签：我怎样才能提取从这个标签？我试过了但我收到了Keyerror。

美丽的soup只是获得标签内的价值

相关阅读

相关文章

相关问答

相关工具

相关文档