当前位置: 首页 > 面试题库 >

不要自动放置html,head和body标签,Beautifulsoup

蓝昊然
2023-03-14
问题内容

将beautifulsoup与html5lib结合使用,它会自动放置html,head和body标签:

BeautifulSoup('<h1>FOO</h1>', 'html5lib') # => <html><head></head><body><h1>FOO</h1></body></html>

有什么我可以设置的选项,请关闭此行为?


问题答案:
In [35]: import bs4 as bs

In [36]: bs.BeautifulSoup('<h1>FOO</h1>', "html.parser")
Out[36]: <h1>FOO</h1>

这将使用Python的内置HTML解析器解析HTML。引用文档:

与html5lib不同,此解析器不尝试通过添加<body>标签来创建格式正确的HTML文档。与lxml不同,它甚至不必费心添加<html>标签。

另外,您可以使用html5lib解析器,然后选择以下元素<body>

In [61]: soup = bs.BeautifulSoup('<h1>FOO</h1>', 'html5lib')

In [62]: soup.body.next
Out[62]: <h1>FOO</h1>


 类似资料:
  • 在我的web应用程序中,我得到了包含默认标题内容的Header.jsp文件。我使用jsp:include标签将它包含在所有其他页面的每个单独页面的body标签中。 标题。jsp包含自己的HEAD标记,用于指定默认的元标记、链接样式表、脚本和一些HTML元素。同时,我将在所有其他单独的页面中使用另一组HEAD标记来定义标题、页面特定的脚本和样式表。 例如: Header.jsp Main.jsp 这

  • 问题内容: 我正在进行ajax调用来获取内容并像下面这样添加内容: 问题是,当我进行更改时,我什么也没得到(没有错误,只有html)。我假设body是一个标签,就像“ a”一样?我究竟做错了什么? 所以这对我有用: 但这不是: 问题答案: 恐怕通过jQuery对象(即)解析返回的HTML 以获取标记注定会失败。 原因是返回的是(try )。现在,根据jQuery文档,当从包含复杂HTML标记的字符

  • 本文向大家介绍python requests.post带head和body的实例,包括了python requests.post带head和body的实例的使用技巧和注意事项,需要的朋友参考一下 如下所示: 以上这篇python requests.post带head和body的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持呐喊教程。

  • 文档类型 为每个 HTML 页面的第一行添加标准模式(standard mode)的声明, 这样能够确保在每个浏览器中拥有一致的表现。 <!DOCTYPE html> 语言属性 为什么使用 lang="zh-cmn-Hans" 而不是我们通常写的 lang="zh-CN" 呢? 请参考知乎上的讨论: 网页头部的声明应该是用 lang="zh" 还是 lang="zh-cn"? <!-- 中文

  • 在我的JFrame上,我使用以下代码在面板上显示图像: 我想“自动调整”标签中的图片大小。的确,有时图像大小只有几个像素,有时更多。 是否有一种方法可以设置标签的大小,然后自动调整标签中的图像大小?

  • 在Chrome Developer中运行aXe可访问性工具时,我在和元素上遇到以下错误 ARIA角色必须适合该元素 我的超文本标记语言如下。 如果我删除了角色,我会得到一个错误,说一个页面必须有一个地标角色,但如果我将main添加回html、head或body,我仍然会得到错误 对于头部和身体来说,与地标相关的可接受的ARIA角色是什么?