当前位置: 首页 > 面试题库 >

我可以使用BeautifulSoup删除脚本标签吗?

楚博雅
2023-03-14
问题内容

是否可以使用BeautifulSoup从HTML中删除脚本标签及其所有内容,还是必须使用正则表达式或其他内容?


问题答案:
>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup('<script>a</script>baba<script>b</script>', 'lxml')
>>> for s in soup.select('script'):
>>>    s.extract()
>>> soup
baba


 类似资料:
  • 问题内容: 我想通过jQuery创建脚本标签。 我使用以下代码: 没用 您将如何实现它? 问题答案: 你应该这样做

  • 问题内容: 我正在使用HTML Purifier(http://htmlpurifier.org/) 我只想删除标签。我不想删除内联格式或任何其他内容。 我该如何实现? 还有一件事,它还有其他方法可以从HTML删除脚本标签 问题答案: 因为这个问题是用正则表达式标记的,所以在这种情况下,我将用穷人的解决方案来回答: 但是,正则表达式不是用于解析HTML / XML的,即使您编写了一个 完美的 表达

  • 我想从每个放回收件箱的邮件中删除“Followup”标签。我尝试过几件事,但仍然没有成功。我希望有人能帮助我,或者给我指出正确的方向。有关职能是: 整个脚本是:

  • 我正在使用BeautifulSoup刮取一个URL,并使用以下代码查找标记,其类为: 现在,在上面的代码中,我们可以使用获取标记和与它们相关的信息,但我想使用XPath。是否可以将XPath与BeautifulSoup一起使用?如果可能,请给我提供示例代码。

  • 问题 我正在尝试从BeautifulSoup下载的html文件中删除诸如 和之类的样式标记。我确实想保留标签包含的内容(比如文本),但这似乎不起作用。 我所尝试的 我尝试使用的URL Python HTML解析和过滤停止词 使用Python和lxml从HTML中删除class属性 BeautifulSoup标签去除

  • Quickly removes tag, found by “Match Tag Pair” from current caret position, and adjusts indentation. 快速删除标签,并调整缩进。这里的标签是在插入符所在位置由 匹配标签 功能查找的标签。 <body> <div |class="wrapper"> <h1>Title</h1>