使用 Heregexes

优质
小牛编辑
139浏览
2023-12-01

问题

你需要写一个复杂的正则表达式。

解决方案

使用 CoffeeScript 的 “heregexes” ——可以忽视内部空白字符并可以包含注释的扩展正则表达式。

pattern = ///
  ^\(?(\d{3})\)? # 采集区域代码,忽略可选的括号
  [-\s]?(\d{3})  # 采集前缀,忽略可选破折号或空格
  -?(\d{4})      # 采集行号,忽略可选破折号
///
[area_code, prefix, line] = "(555)123-4567".match(pattern)[1..3]
# => ['555', '123', '4567']

讨论

通过打破复杂的正则表达式和注释重点部分,它们变得更加容易去辨认和维护。例如,现在这是一个相当明显的做法去改变正则表达式以容许前缀和行号之间存在可选的空间。

heregexes 中的空白字符

空白字符在 heregexes 中是被忽视的——所以如果要为 ASCII 空格匹配字符,你应该怎么做呢?

我们的解决方案是使用 @\s@ 字符组,它能够匹配空格,制表符和换行符。假如你只想匹配一个空格,你需要使用 \X20 来表示字面上的 ASCII 空格。