当前位置: 首页 > 知识库问答 >
问题:

带有多个捕获组的正则表达式

慕容晔
2023-03-14

我有一个工作正则表达式来提取一些信息。php代码如下所示:

<?php

$re = "/(\\d{2}.\\d{2}.\\d{2}).+(\\w{3}).+\\w{3}.+(\\w{2}\\s\\d{4}).+(\\d{2}:\\d{2}\\n).+(\\d{2}.\\d{2}.\\d{2}).+(\\w{2}\\s\\d{4}).+(\\d{2}:\\d{2}\\n).+((FNC|PXO)\\d{3})/"; 
$str = "***NEUBUCHUNG ***\n 24.01.15  TXL  FNC  AB 2306  11:40   15:20\n 31.01.15  FNC  TXL  AB 2307  16:05\n FNC044  RESIDENCIAL VILA LUSITANI    9000-120 FUNCHAL\n  1  DOPPELZIMMER                     FRUEHSTUECK\n SPO1101\n INKL. REISELEITUNG UND TRANSFER AB/BIS\n FLUGHAFEN\n F368966  HERR EIDAM, KLAUS               54\n F368966  FRAU EIDAM, SONJA               54"; 

$str2 = "***ÄNDERUNG ***\nNEU:11.04.15 DUS  AB 2646  13:15   16:25\n    18.04.15 FNC  DUS  AB 2647  17:15\n   FNC027    PESTANA CARLTON MADEIRA   9004-531 FUNCHAL\n 1  DO-MEERBLICK                       F\nF365474 HERR   PETERS, HANS                                O 03.01.15\nLANGZEITERMÄSSIGUNG 10%\nSPO-JAN_SALES 20%\nFRÜHBUCHER 10%\nINKL. REISELEITUNG UND TRANSFER AB/BIS\nFLUGHAFEN\nZimmer in ruhiger Lage\n(unverbindlicher Kundenwunsch)\nNEU:\nF365474 FRAU   PETERS, ULRIKE                              O 03.01.15"; 

preg_match($re, $str, $matches);
print_r($matches)
?>

https://ideone.com/UdIaA7

与str:https://regex101.com/r/rF0uP7/5

带有str2的正则表达式:https://regex101.com/r/cV6iF9/1

然而,它在str上工作得很好,但在str2上却不匹配,我找不到原因

共有2个答案

云宏儒
2023-03-14

。开头的(\w{3})必须是可选的。用(?:(\w{3})包装它

查看regex演示

另外,您的太多了,在大多数地方,您的意思是只匹配空白,因此最好将其转换为\s。此外,要匹配文字点的点必须转义。

使用更优化的:

(\d{2}\.\d{2}\.\d{2})(?:\s+(\w{3}))?\s+\w{3}\s+(\w{2}\s\d{4}).+(\d{2}:\d{2}\n)\s+(\d{2}\.\d{2}\.\d{2}).+(\w{2}\s\d{4})\s+(\d{2}:\d{2}\n).+((FNC|PXO)\d{3})

看看这个正则表达式演示

董昕
2023-03-14

然而,它在str上工作得很好,但在str2上却不匹配,我找不到原因

这是罪魁祸首表达式:(\\w{3})\\w{3}

在$str中,你有24.01.15 TXL FNC AB

但是在$str2中,您有:11.04。15 DUS AB

您的正则表达式可以读得更好,如下所示:

$re = "#(\d{2}\.\d{2}\.\d{2})(?:\s+(\w{3}))?\s+\w{3}\s+(\w{2}\s\d{4}).+(\d{2}:\d{2}\n)\s+(\d{2}\.\d{2}\.\d{2}).+(\w{2}\s\d{4})\s+(\d{2}:\d{2}\n).+((FNC|PXO)\d{3})#si"; 

快速测试。

 类似资料:
  • 假设我有这个虚拟URL,我需要提取植物及其颜色作为 下面的I have正在按预期捕获我需要的元素,但是当我的URL中的植物少于4株时,它无法捕获任何东西。底部有一个指向regex测试员的链接,其中有示例代码和URL,您可以使用。 如何修改这个正则表达式,使其动态工作,从而在不需要静态URL结构的情况下捕获可用内容。现在,假设我最多只能捕获4株植物(8组) https://regex101.com/

  • 在Python中,如何在非捕获组中捕获组?换句话说,如何重复包含捕获组的非捕获子模式? 例如,捕获导入字符串上的所有包名。例如,字符串: 导入熊猫、操作系统、系统 将返回“pandas”、“os”和“sys”。下面的模式捕获第一个包并到达第二个包: 从这里,我想重复捕获组并匹配以下字符的子模式,即。当我用一个非捕获组包围这个子模式并重复它时: 它不再捕捉里面的群体。

  • 问题内容: 我正在尝试使用Java expr在:之后捕获正确的部分,但是在以下代码中,打印的捕获组是整个字符串,怎么了? 问题答案: 子组的编号从1开始,全文为0。只需循环执行count + 1。

  • 问题内容: 使用(jdk 1.6),在给定以下代码的情况下,应用于主题字符串的正则表达式将仅捕获而不应捕获(模式)正则表达式: 奇怪的是,另一个类似的正则表达式(如应用于主题字符串)捕获组0和1,但不捕获组2。 相反,通过使用JavaScript的RegExp对象,可以将完全相同的正则表达式应用于完全相同的主题字符串,从而捕获所有组。我通过使用以下在线测试器亲自检查并重新检查了这一事实: http

  • 本文向大家介绍PHP正则表达式之捕获组与非捕获组,包括了PHP正则表达式之捕获组与非捕获组的使用技巧和注意事项,需要的朋友参考一下 今天遇到一个正则匹配的问题,忽然翻到有捕获组的概念,手册上也是一略而过,百度时无意翻到C#和Java中有对正则捕获组的特殊用法,搜索关键词有PHP时竟然没有相关内容,自己试了一下,发现在PHP中也是可行的,于是总结一下,分享的同时也希望有大神和细心的学习者找到我理解中

  • 我有一个字符串,可以通过以下方式格式化: 我试图(分别)捕获: 这是我的正则表达式:(也可能是,因为我不关心完整的捕获,只关心它的各个部分)。它捕获: 或(备用) 我不太明白如何让重复捕获组捕获所有单个实例,而不是整个事物,并且只是最后一个实例或只是最后一个实例。