当前位置：首页 > 编程笔记 >

python re模块匹配贪婪和非贪婪模式详解

唐钊

2023-03-14

本文向大家介绍python re模块匹配贪婪和非贪婪模式详解，包括了python re模块匹配贪婪和非贪婪模式详解的使用技巧和注意事项，需要的朋友参考一下

这篇文章主要介绍了python re模块匹配贪婪和非贪婪模式详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

python贪婪和非贪婪

正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的（在少数语言里也可能是默认非贪婪），总是尝试匹配尽可能多的字符；非贪婪则相反，总是尝试匹配尽可能少的字符。在"*","?","+","{m,n}"后面加上？，使贪婪变成非贪婪。

>>> s="This is a number 234-235-22-423"
>>> r=re.match(".+(\d+-\d+-\d+-\d+)",s)
>>> r.group(1)
'4-235-22-423'
>>> r=re.match(".+?(\d+-\d+-\d+-\d+)",s)
>>> r.group(1)
'234-235-22-423'
>>>

正则表达式模式中使用到通配字，那它在从左到右的顺序求值时，会尽量“抓取”满足匹配最长字符串，在我们上面的例子里面，“.+”会从字符串的启始处抓取满足模式的最长字符，其中包括我们想得到的第一个整型字段的中的大部分，“\d+”只需一位字符就可以匹配，所以它匹配了数字“4”，而“.+”则匹配了从字符串起始到这个第一位数字4之前的所有字符。

解决方式：非贪婪操作符“？”，这个操作符可以用在"*","+","?"的后面，要求正则匹配的越少越好。

下面这个例子仔细体会下

>>> re.match(r"aa(\d+)","aa2343ddd").group(1)
'2343'
>>> re.match(r"aa(\d+?)","aa2343ddd").group(1)
'2'
>>> re.match(r"aa(\d+)ddd","aa2343ddd").group(1) 
'2343'
>>> re.match(r"aa(\d+?)ddd","aa2343ddd").group(1)
'2343'
>>>

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持小牛知识库。

类似资料：

与 grep 的非贪婪匹配

据我所知，非贪婪匹配不是基本正则表达式（BRE）和扩展正则表达式（ERE）的一部分。然而，不同版本的（BSD和GNU）上的行为似乎表明了另一种明智的做法。举个例子，我们来看下面这个例子。我有一串话要说: 以下是从字符串中提取< code>hello的一些尝试。 BRE尝试（失败）：输出产生整个字符串，这表明非贪婪量词在 BRE 上不起作用。请注意，我只是转义，因为不会失去它的意义，也不需要转义
Lexer lookahead在ANTLR3和ANTLR4中如何使用贪婪和非贪婪匹配？

基本上，我试图为lexer指定尝试匹配(LOWCHARHIGHCHAR)的非贪婪方式，因此它停止在关键字lookahead。到目前为止，我所读到的关于ANTLR lexer的内容是，应该有某种lexer规则的优先级。如果我在lexer语法中首先指定关键字lexer规则，那么后面的任何lexer规则都不能匹配所使用的字符。经过一番搜索，我明白了这里的问题是它不能以正确的方式标记输入，因为例如对于输
6.3 贪婪 vs 不贪婪

贪婪 vs 不贪婪当重复一个正则表达式时，如用 a*，操作结果是尽可能多地匹配模式。当你试着匹配一对对称的定界符，如 HTML 标志中的尖括号时这个事实经常困扰你。匹配单个 HTML 标志的模式不能正常工作，因为 .* 的本质是“贪婪”的 #!python >>> s = '<html><head><title>Title</title>' >>> len(s) 32 >>> print re.
php正则表达式中贪婪与非贪婪介绍

本文向大家介绍php正则表达式中贪婪与非贪婪介绍，包括了php正则表达式中贪婪与非贪婪介绍的使用技巧和注意事项，需要的朋友参考一下一、贪婪与非贪婪什么叫贪婪，比如说要从字符串中<td>面包一</td><td>面包二</td>吃面包，本来你只可以吃面包一，可是你贪心，于是就把第一个<td>到最后一个</td>里面的两个面包取出来了，你想多吃点，非贪婪也就是你不贪吃了，就只吃面包一。我们来看看正
Python正则表达式教程之三：贪婪/非贪婪特性

本文向大家介绍Python正则表达式教程之三：贪婪/非贪婪特性，包括了Python正则表达式教程之三：贪婪/非贪婪特性的使用技巧和注意事项，需要的朋友参考一下之前已经简单介绍了Python正则表达式的基础与捕获，那么在这一篇文章里，我将总结一下正则表达式的贪婪/非贪婪特性。贪婪默认情况下，正则表达式将进行贪婪匹配。所谓“贪婪”，其实就是在多种长度的匹配字符串中，选择较长的那一个。例如，如下
贪婪算法

本文向大家介绍贪婪算法相关面试题，主要包含被问及贪婪算法时的应答技巧和注意事项，需要的朋友参考一下参考回答：贪婪算法(贪心算法)是指在对问题进行求解时，在每一步选择中都采取最好或者最优(即最有利)的选择，从而希望能够导致结果是最好或者最优的算法。贪婪算法所得到的结果往往不是最优的结果(有时候会是最优解)，但是都是相对近似(接近)最优解的结果。贪婪算法并没有固定的算法解决框架，算法的关键是贪婪策

相关阅读

什么是正则的贪婪匹配？Python正则表达式：贪婪模式返回多个空匹配 Java中的非贪婪正则表达式 python正则表达式的懒惰匹配和贪婪匹配说明 js正则表达式惰性匹配和贪婪匹配用法分析

相关文章

Java14 instanceof的模式匹配串的模式匹配（KMP算法）BF算法（串模式匹配算法）Perl 包和模块适配器模式

相关问答

ANTLR4中来自列表的令牌的非贪婪匹配 antlr解析器贪婪吗？如何编写与非贪婪匹配的正则表达式？[重复]JavaScript中的贪婪算法 awk中多字符分隔符的非贪婪正则表达式匹配

相关工具

UIAlerVIew 管理模块设计模式Java版局域网内CS模式消息互发简单邮件联系页面带飞信通知模块微信公共平台开发模式Node.js SDK

相关文档

JavaScript 模式设计模式 Java 设计模式 PHP 设计模式 Java 设计模式