当前位置：首页 > 编程笔记 >

Python正则表达式匹配HTML页面编码

苗信鸥

2023-03-14

本文向大家介绍Python正则表达式匹配HTML页面编码，包括了Python正则表达式匹配HTML页面编码的使用技巧和注意事项，需要的朋友参考一下

html页面一般都会指定一个编码，如何获取到是处理html页面的第一步，因为错误的编码必然带来后面处理的问题。这里我用python的正则表达式写了个：

import re

a = ["<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />",
   '<meta http-equiv=Content-Type content="text/html;charset=gb2312">',
   '<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
   '<meta http-equiv="content-type" content="text/html; charset=utf-8" />',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />'
   ]



b = "<meta[ ]+http-equiv=["']?content-type["']?[ ]+content=["']?text/html;[ ]*charset=([0-9-a-zA-Z]+)["']?"


B = re.compile(b, re.IGNORECASE)


for ax in a:
  r1 = B.search(ax)

  if r1:
    print r1.group()
    print r1.group(1), len(r1.group())
  else:
    print 'not match'

类似资料：

>>正则表达式匹配

我们得到了一些这样的内容：
与正则表达式匹配的正则表达式

有没有人试图描述与正则表达式匹配的正则表达式？由于重复的关键字，这个主题几乎不可能在网上找到。它可能在实际应用程序中不可用，因为支持正则表达式的语言通常具有解析它们的方法，我们可以将其用于验证，以及一种在代码中分隔正则表达式的方法，可用于搜索目的。但是我仍然想知道匹配所有正则表达式的正则表达式是什么样子的。应该可以写一个。
Python正则表达式匹配日期

问题内容：我在Python中使用什么正则表达式来匹配这样的日期：“ 11/12/98”？问题答案：与其使用正则表达式，不如将字符串解析为对象通常更好：然后，您可以访问日，月和年（以及小时，分钟和秒）作为对象的属性：要测试用正斜杠分隔的数字序列是否表示有效日期，可以使用一个块。无效的日期将引发：如果您需要搜索更长的字符串以获取日期，则可以使用正则表达式来搜索以正斜杠分隔的数字：当然，无
Python正则表达式匹配撇号

出于某种原因，上面的正则表达式没有捕捉带撇号的名称。例如：D'STALL先生不匹配。任何关于regex模式的帮助都将不胜感激。代码所做的是获取输入并用XML标记它。诸如以下内容：正则表达式与上述段落不匹配。
正则表达式 - 匹配规则

主要内容：基本模式匹配,字符簇,确定重复出现基本模式匹配一切从最基本的开始。模式，是正则表达式最基本的元素，它们是一组描述字符串特征的字符。模式可以很简单，由普通的字符串组成，也可以非常复杂，往往用特殊的字符表示一个范围内的字符、重复出现，或表示上下文。例如：这个模式包含一个特殊的字符 ^，表示该模式只匹配那些以 once 开头的字符串。例如该模式与字符串 "once upon a time" 匹配，与 "There once was
Java正则表达式匹配

问题内容：当字符串以数字开头时，我需要匹配，然后是一个点，然后是一个空格和1个或多个大写字符。匹配必须发生在字符串的开头。我有以下字符串。我尝试过的正则表达式是：它不匹配。一个有效的正则表达式将对这个问题有什么作用？问题答案：（对不起，我先前的错误。大脑现在坚定地投入了。嗯，也许。）这有效：分解： =字符串开头 =一个或多个数字（之所以转义，是因为它在字符串中，因此） =文字（或者

相关阅读

Python正则表达式字符串匹配？正则表达式通配符匹配重叠正则表达式匹配 Python正则表达式匹配整个单词在python正则表达式中匹配括号

相关文章

Perl 正则表达式 Ruby 正则表达式 MongoDB正则表达式 C#正则表达式 Java正则表达式

相关问答

STD：：正则表达式不匹配正则表达式匹配年份？与模式匹配的正则表达式 HTML5模式正则表达式密码匹配 Swift提取正则表达式匹配

相关工具

正则表达式测试器 WizTools.org正则表达式测试工具 Quartz 表达式生成器解析html网页的数据《函数式编程指南》

相关文档

正则表达式 Python 正则表达式操作指南正则表达式（regular expression）Java 正则表达式教程 java.util.regex 正则表达式中文教程