选择(OR)|

优质
小牛编辑
133浏览
2023-12-01

选择是正则表达式中的一个术语,实际上是一个简单的“或”。

在正则表达式中,它用竖线 | 表示。

例如,我们需要找出编程语言:HTML、PHP、Java 或 JavaScript。

对应的正则表达式为:html|php|java(script)?

用例如下:

let reg = /html|php|css|java(script)?/gi;

let str = "First HTML appeared, then CSS, then JavaScript";

alert( str.match(reg) ); // 'HTML', 'CSS', 'JavaScript'

我们已知的一个相似符号 —— 方括号。就允许在许多字符中进行选择,例如 gr[ae]y 匹配 graygrey

选择符号并非在字符级别生效,而是在表达式级别。正则表达式 A|B|C 意思是命中 ABC 其一均可。

例如:

  • gr(a|e)y 严格等同 gr[ae]y
  • gra|ey 匹配 “gra” or “ey”。

我们通常用圆括号把模式中的选择部分括起来,像这样 before(XXX|YYY)after

时间正则表达式

在之前的章节中有个任务是构建用于查找形如 hh:mm 的时间字符串,例如 12:00。但是简单的 \d\d:\d\d 过于模糊。它同时匹配 25:99

如何构建更优的正则表达式?

我们可以应用到更多的严格匹配结果中:

  • 首个匹配数字必须是 01,同时其后还要跟随任一数字。
  • 或者是数字 2 之后跟随 [0-3]

构建正则表达式:[01]\d|2[0-3]

接着可以添加冒号和分钟的部分。

分钟的部分必须在 059 区间,在正则表达式语言中含义为首个匹配数字 [0-5] 其后跟随任一数字 \d

把它们拼接在一起形成最终的模式 [01]\d|2[0-3]:[0-5]\d

快大功告成了,但仍然存在一个问题。选择符 |[01]\d2[0-3]:[0-5]\d 之间。这是错误的,因为它只匹配符号左侧或右侧任一表达式。

let reg = /[01]\d|2[0-3]:[0-5]\d/g;

alert("12".match(reg)); // 12 (matched [01]\d)

这个错误相当明显,但也是初学正则表达式的常见错误。

我们需要添加一个插入语用于匹配时钟:[01]\d2[0-3]

以下为正确版本:

let reg = /([01]\d|2[0-3]):[0-5]\d/g;

alert("00:00 10:10 23:59 25:99 1:2".match(reg)); // 00:00,10:10,23:59