当前位置: 首页 > 面试题库 >

在Python中验证(X)HTML

何长恨
2023-03-14
问题内容

验证文档是否遵循某种版本的HTML(最好是我可以指定)的最佳方法是什么?我希望能够知道失败发生的地方,例如基于Web的验证器,但本机Python应用程序除外。


问题答案:

XHTML很简单,请使用lxml。

from lxml import etree
from StringIO import StringIO
etree.parse(StringIO(html), etree.HTMLParser(recover=False))

HTML更加困难,因为传统上对HTML人群的验证没有太大兴趣(通过验证器yikes运行StackOverflow本身)。最简单的解决方案是执行诸如nsgmls或OpenJade之类的外部应用程序,然后解析其输出。



 类似资料:
  • 问题内容: 我想让用户输入日期,例如: 然后确保输入的是有效日期。我不太在乎日期格式。 感谢您的任何投入。 问题答案: 您可以使用模块的功能: 请注意,在Python 2.x中,您需要使用而不是。

  • 尽管我保留了verify=false,但在Python中还是出现了ssl错误。你能告诉我如何避免吗?但是curl命令使用-k选项。 错误:

  • 本文向大家介绍在Python中验证IP地址,包括了在Python中验证IP地址的使用技巧和注意事项,需要的朋友参考一下 假设我们有一个字符串;我们必须检查给定的输入是否是有效的IPv4地址或IPv6地址,或者都不是。 IPv4地址以点分十进制表示法规范表示,点分十进制表示法由四个十进制数字组成,每个数字范围为0到255,并用点号(“。”)分隔,例如192.168.254.1;此外,IPv4地址中的

  • 问题内容: 我正在使用Play!框架v2.3(Java),我想向我的Web应用程序添加一些用户身份验证,即每个用户的用户名/密码和注册过程。 我在文档中找到了一些有关如何针对v2.1和v2.2执行此操作的信息:http : //www.playframework.com/documentation/2.1.0/JavaGuide4 https://www.playframework.com/doc

  • 问题内容: 可以说我有这样的东西(客户端代码): 这段代码是完整的功能,但是我真的不知道如何根据pem文件中可用的一个具体的CA证书来验证服务器的证书。 所有证书均由我的自签名CA签名,这是我需要根据其进行验证的CA(仅针对此证书)。 每个答案表示赞赏。 编辑: 回应 jglouie (非常感谢您-无法投票支持您的答案)。 我创建了解决方案: 问题答案: 我假设您的CA的自签名证书已按以下方式加载

  • 我们正在使用plivo发送/接收SMS消息。我们配置了一个网络钩子来接收客户发送的消息。我们想验证请求是否实际上来自plivo。有人能告诉我如何使用我们拥有的身份验证令牌进行验证吗?