当前位置：首页 > 面试题库 >

仅从此元素提取文本，而不从其子元素提取文本

白星渊

2023-03-14

问题内容：

我只想从汤中最上面的元素中提取文本；但是汤.text也会给出所有子元素的文本：

我有

import BeautifulSoup
soup=BeautifulSoup.BeautifulSoup('<html>yes<b>no</b></html>')
print soup.text

输出为yesno。我只想“是”。

实现此目标的最佳方法是什么？

编辑：我也想yes在解析’ <html><b>no</b>yes</html>‘时输出。

问题答案：

那又如何.find(text=True)呢？

>>> BeautifulSoup.BeautifulSOAP('<html>yes<b>no</b></html>').find(text=True)
u'yes'
>>> BeautifulSoup.BeautifulSOAP('<html><b>no</b>yes</html>').find(text=True)
u'no'

编辑：

我想我已经了解了你现在想要的。尝试这个：

>>> BeautifulSoup.BeautifulSOAP('<html><b>no</b>yes</html>').html.find(text=True, recursive=False)
u'yes'
>>> BeautifulSoup.BeautifulSOAP('<html>yes<b>no</b></html>').html.find(text=True, recursive=False)
u'yes'

类似资料：

硒：不能从父元素中提取子元素

我正在尝试使用以下结构单击element：但是，这将抛出。我当前正在使用:刮取（父）元素列表。这标识了正确的元素列表（按预期工作）。有了列表后，我应用以下函数：使用: 而且但是，这将触发。我对此进行了几个小时的研究，基于几个帖子，我添加了“。”在两个斜杠之前，这表示相对于父级（而不是相对于整个DOM）。如果我移除这个点，我总是得到页面上的第一个元素--而不是列表中每个父元素的子元素。
Python元素树-从元素中提取文本，剥离标签

问题内容：使用Python中的ElementTree，如何从节点中提取所有文本，剥离该元素中的所有标签并仅保留文本？例如，说我有以下内容：我想回来。我该怎么做呢？到目前为止，我所采用的方法产生了相当灾难性的结果。问题答案：如果您在Python 3.2+下运行，则可以使用。创建一个文本迭代器，该迭代器按文档顺序循环遍历此元素和所有子元素，并返回所有内部文本：如果您在较低版本的Pytho
从不带子元素的元素内部获取文本

我正在浏览一个包含几个元素的网页，我想在不包含其子元素的情况下获取其中的文本。页面结构如下：当我使用时，得到的结果是：我正在使用BeautifulSoup4和Python3
Testcafe从元素获取文本

我想从Chrome的模态中得到一条短信。使用控制台，我可以获得如下内部文本：现在，在我的测试中，我可以使用我甚至可以点击那个网址例如，我不能将内部文本放入变量。我试着使用这篇文章中的ClientFunction 并尝试使用本文建议的普通选择器如何从元素中提取文本？我知道在这种情况下是有限的，对吗？
为元素属性中的文本值匹配从jsoup中提取元素

如何获取属性中具有特定文本的跨度？我正在尝试提取文本“星星”后面的数字。那么我怎么能选择一个包含文本“rating_sprite星”的 span 标签，并且我希望从属性中提取值“star5”，以便我可以从文本中获取 5。目前我没有收到任何元素！ HTML代码段如下所示
如何从父元素获取文本并从子元素中排除文本（C＃Selenium）

问题内容：是否可以仅从父元素而不是Selenium中的子元素获取文本？示例：假设我有以下代码：用C＃（或任何语言），我将有：但是，链接文本将带有“ Google Link此链接会将您带到Google主页”。如果不进行大量的字符串操作（例如获取所有子项的文本并从父项的结果文本中减去该文本），是否有办法从父项元素中仅获取文本？问题答案：这是一个常见的问题，因为您无法直接访问文本节点- 换

相关阅读

如何更改元素的文本而不更改其子元素？如何在Selenium WebDriver中获取元素的文本，而不包括子元素文本？从LinearLayout获取子元素 jQuery-获取没有子文本的元素的文本如何从XMLType节点提取元素路径？

相关文章

WSDL2.0 <service>元素 WSDL2.0 <binding>元素 WSDL2.0 <interface>元素 WSDL2.0 <element>元素 WSDL <service>元素

相关问答

如何从父元素中获取文本并从子元素中排除文本（C#Selenium）如何从水豚元素中提取硒元素？从JSON中提取特定元素如何在Selenium WebDriver中获取元素的文本，而不包含子元素文本？使用驱动程序后从元素中提取文本。按_id查找_元素_[重复]

相关工具

元素周期表自动文字提示列表并元 Marlin 中文版本 LCD JOE文本编辑器

相关文档

Makeblock 神经元帮助文档 Python 取证中文教程 Python 文本处理 Node.js 中文电子书 Java 提高篇