选择(OR)|
优质
小牛编辑
133浏览
2023-12-01
选择是正则表达式中的一个术语,实际上是一个简单的“或”。
在正则表达式中,它用竖线 |
表示。
例如,我们需要找出编程语言:HTML、PHP、Java 或 JavaScript。
对应的正则表达式为:html|php|java(script)?
。
用例如下:
let reg = /html|php|css|java(script)?/gi;
let str = "First HTML appeared, then CSS, then JavaScript";
alert( str.match(reg) ); // 'HTML', 'CSS', 'JavaScript'
我们已知的一个相似符号 —— 方括号。就允许在许多字符中进行选择,例如 gr[ae]y
匹配 gray
或 grey
。
选择符号并非在字符级别生效,而是在表达式级别。正则表达式 A|B|C
意思是命中 A
、B
或 C
其一均可。
例如:
gr(a|e)y
严格等同gr[ae]y
。gra|ey
匹配 “gra” or “ey”。
我们通常用圆括号把模式中的选择部分括起来,像这样 before(XXX|YYY)after
。
时间正则表达式
在之前的章节中有个任务是构建用于查找形如 hh:mm
的时间字符串,例如 12:00
。但是简单的 \d\d:\d\d
过于模糊。它同时匹配 25:99
。
如何构建更优的正则表达式?
我们可以应用到更多的严格匹配结果中:
- 首个匹配数字必须是
0
或1
,同时其后还要跟随任一数字。 - 或者是数字
2
之后跟随[0-3]
。
构建正则表达式:[01]\d|2[0-3]
。
接着可以添加冒号和分钟的部分。
分钟的部分必须在 0
到 59
区间,在正则表达式语言中含义为首个匹配数字 [0-5]
其后跟随任一数字 \d
。
把它们拼接在一起形成最终的模式 [01]\d|2[0-3]:[0-5]\d
。
快大功告成了,但仍然存在一个问题。选择符 |
在 [01]\d
和 2[0-3]:[0-5]\d
之间。这是错误的,因为它只匹配符号左侧或右侧任一表达式。
let reg = /[01]\d|2[0-3]:[0-5]\d/g;
alert("12".match(reg)); // 12 (matched [01]\d)
这个错误相当明显,但也是初学正则表达式的常见错误。
我们需要添加一个插入语用于匹配时钟:[01]\d
或 2[0-3]
。
以下为正确版本:
let reg = /([01]\d|2[0-3]):[0-5]\d/g;
alert("00:00 10:10 23:59 25:99 1:2".match(reg)); // 00:00,10:10,23:59