当前位置: 首页 > 文档资料 > Python 之旅 >

正则表达式

优质
小牛编辑
194浏览
2023-12-01

正则表达式(regular expression)是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串,可以匹配其自身。比如,正则表达式 ‘hello’ 可以匹配字符串 ‘hello’。

要注意的是,正则表达式并不是一个程序,而是用于处理字符串的一种模式,如果你想用它来处理字符串,就必须使用支持正则表达式的工具,比如 Linux 中的 awk, sed, grep,或者编程语言 Perl, Python, Java 等。

正则表达式有多种不同的风格,下表(改编自 huxi)列出了适用于 Python 或 Perl 等编程语言的部分元字符以及说明:

实例

  • 匹配 python.org 的正则表达式:
  1. python.org

注:如果使用 python.org 来匹配,由于 . 可以匹配任意一个字符(换行符除外),因此,它也会匹配到类似 pythonmorg 的字符串,为了匹配点号,我们需要加 来转义。

  • 匹配 010-85692930 的正则表达式:
  1. d{3}-d{8}

注:d 表示匹配数字,d{3} 表示匹配 3 个数字,- 表示匹配 -

  • 匹配由数字、26个英文字母或下划线组成的字符串的正则表达式:
  1. ^w+$

  1. ^[0-9a-zA-Z_]+$
  • 匹配 13、15、18 开头的手机号的正则表达式:
  1. ^(13[0-9]|15[0|1|2|3|5|6|7|8|9]|18[0-9])d{8}$
  • 匹配金额,精确到 2 位小数
  1. ^[0-9]+(.[0-9]{2})?$
  • 匹配中文的正则表达式:
  1. ^[u4e00-u9fa5]{0,}$

注:中文的 unicode 编码范围主要在 u4e00-u9fa5

参考资料