当前位置: 首页 > 面试题库 >

是否有内置的程序包将html解析为dom?

沈博延
2023-03-14
问题内容

我找到HTMLParser了SAX和xml.minidomXML。我有一个格式良好的HTML,因此不需要太强大的解析器-有什么建议吗?


问题答案:

看一看BeautifulSoup。它在解析HTML方面很受欢迎并且非常出色。



 类似资料:
  • 问题内容: 如果我们将Apache Web服务器设置为将Apache配置为将 所有 HTML 处理为PHP,是否存在安全性/性能方面的顾虑?我专门指的是: 我当时需要将一些PHP逻辑添加到一些HTML文件中;理想情况下,我不必将文件名更改为(保持的页面排名等)。 这与以下问题有关:httpd AddType指令 编辑: 从下面的现有答案/评论中,社区似乎建议使用重定向或仅针对特定的HTML文件。约

  • 问题内容: 我正在尝试获取以html格式格式化的文本片段,以在UITableViewCell中的iPhone上很好地显示。 到目前为止,我有这个: 这种作品。我得到一些加粗的“ Nice”文字!但是…它还将字体设置为Times Roman!这不是我想要的字体。我想我需要在documentAttributes中设置一些内容,但是,我在任何地方都找不到任何示例。 问题答案: 弄清楚了。有点负担,也许不

  • 问题内容: 我想使用HTML敏捷包来解析复杂网页中的表,但是我迷失在对象模型中。 我看了链接示例,但没有以这种方式找到任何表数据。我可以使用XPath获取表吗?在加载有关如何获取表的数据之后,我基本上迷失了。我以前在Perl中完成过此操作,虽然有点笨拙,但是可以。()。 如果有人能够阐明正确的对象顺序进行解析,我也很高兴。 问题答案: 怎么样:使用HTML Agility Pack 请注意,如果需

  • 我有一个适配器,它必须显示从服务器获得的HTML内容,但我不能为每个适配器项使用WebView,因为性能很差。。。 我认为唯一可能的解决方案是将每个HTML解析为TextView。 在iOS中,DTCoreText库实现了这一点。Android中是否有类似的库?Html。fromHtml()只支持一些标记,我需要将元素显示为列表、表格、嵌入的图像和视频、表情符号。。。

  • 问题内容: 有什么方法可以显示HTML标签而不进行解析?像这样的标签以前工作得很好,但是现在被它取代的并不是那么酷。看一下这个例子: 我正在寻找的等效于旧的XMP标签。新的PRE标签将解析代码。 问题答案: 您可以将元素及其设置用于表示纯文本,并将其属性设置为。这仅影响解析行为:除了元素本身的结束标记之外,无法识别任何标记(标记,实体或字符引用)。(所以它不是 很 一样,这里的认可标签。)你可以单

  • 问题内容: 我一直在浏览教程和书籍,但是找不到内置产品函数,即与sum()相同类型的产品,但是找不到诸如的任何内容。 是通过导入运算符在列表中找到商品的唯一方法吗? 问题答案: 发音 是的,这是对的。Guido拒绝了内置prod()函数的想法,因为他认为很少需要它。 Python 3.8更新 在Python 3.8中, prod() 已添加到math模块: 用reduce()替代 正如您建议的那样