写在前面的话
正则表达式它的强大字符串匹配功能,导致目前在各种程序语言中,都非常流行!它被用来描述或者匹配一系列符合某个句法规则的字符串。很多刚刚使用正则表达式都是从听说这个,然后在要使用时候去网上搜索。 很少人一开始就系统去学习正则表达式,从定义原理使用系统学习。因为,对应初学者觉得它太麻烦了,好多原字符。看到那么长一串字符,就很头痛。因此,也懒得去学习。一般遇到问题,直接去网上搜索。如:“邮箱正则表达式,手机号正则表达式,url正则表达式…..” ,我们发现一个很有意思现象,“怎么邮箱正则表达式可以各种各样,url正则表达式也不相同“,都出都在推荐,都说自己是正确的,到底那个是正确的呢?
从各异的正则表达式,我们可以得出2个结论。一、正则表达式很灵活,多种方法可以实现同一种结果(条条大路通罗马),二、正则表达式匹配结果需要验证的,复杂正则表达式很容易产生错误匹配。今天,我这里不说正则表达式灵活性,我们看看常见正则表达式错误使用,产生功能漏洞例子。希望,我们在使用时候多多注意。以下例子,来自我工作中审核代码,经常出现例子,也欢迎朋友们补充!
定界符”^$”缺失bug
<?php ///检测用户名,只能是字符加数字 $user="chengmo8"; if(!preg_match("<strong>/[0-9a-zA-Z]+/</strong>",$user)) { exit("用户名错误!"); }
这是很常见的,因为没有定界符,正则表达式搜索,会从$user中,字符中从左向右搜索,指导找到满足条件的字符,就会匹配到,并且返回true,程序将继续执行。我们测试,用户名输入:chengmo8,chengmo8??!,#$chengm,中国cadadf,都可以匹配成功,看似要限制只能字符加数字用户名。实际由于缺乏限定符正则表达式,变成了,只要字符串中包含字母加数字就可以注册。而我们需要的是,从头到尾字符串必须是字母加数字。正则表达式应该是:^[0-9a-zA-Z]+$ ,看似简单,在做从头到尾字符匹配时候,不要忘记了^$字符。一个匹配输入字符开头,一个匹配输入字符结尾(默认换行符前)
这种经常做,手机号,邮箱,url,注册用户名,密码等。都需要有限定符号!
方括号字符"[ ]”中字符使用Bug
在正则表达式中,常见正则表达式原字符(.*?等等)在方括号字符中将变成普通字符。 在方括号字符中,表示特殊字符,只有“^-\” 3个字符是特殊字符。其中,“^”字符,在左方括号第一个字符时候,是代表不在后面所有字符中字符!
如:[^0]不能是0字符。而如果是:[0^] ,就代表包含0^字符了。因为:^已经不是左括号最右边一个字符了。 已经跟普通字一样了。“-”字符代表是范围字符,如:[0-9] 代表是匹配0到9直接字符。”\”转义字符,如果想匹配”-“字符,可以[0\-9],如果要匹配”\”,可以是:[0\\9],表示“09\” 3个字符了。说这么些,其实就是因为,很多朋友在使用方括号字符时候,经常会弄错特殊字符。
<?php ///检测用户名,只能是字符加数字 $code = ""; ///匹配字符范围包含.*? preg_match("/[.*?]+/",$code); ///匹配字符范围包含a到z 26个字符 preg_match("/[a-z]+/",$code); ///匹配字符范围包含A到z 实际上,是从默认情况ascii表中,A字符到z字符中间,一共48字符 preg_match("/[A-z]+/",$code); ///匹配字符范围包含A到z 是对应ascill码,16进制 preg_match("/[x41-x7A]+/",$code); ///只想匹配字符串and preg_match("/[and]/",$code); ///实际匹配,所有包含a,n,d 组成所有字符,跟顺序无关
加红是经常错误理解,只想匹配and,一旦加入到"[ ]"中字符,可以理解为所有字符组成字符 集合。任意在其中出现字符,就可以匹配,跟顺序无关系!如果真需要匹配这类,按字符分组来,如”and|bnd” 将匹配and字符串,或者是bnd字符串。”|”字符是,字符串或操作符。左右两边连续字符串会组合为一个整体匹配。
好了,今天就整理,常见正则表达式,2种常见错误。欢迎大家交流!
下面是我正在使用的正则表达式的最新版本,它抛出了错误“Invalid regular expression” XSD:正则表达式在位置4验证失败:当前选项设置不支持此表达式。 我在xsd文件中得到了这个异常,我正在message broker(IIB)中开发这个xsd。有谁能帮我解决这个问题吗?
我目前正在尝试创建一个日志解析器,它从一个输入文件(a.log)中获取以下格式的一系列ping报告:(194.12.224.34中的64字节:icmp_seq=1 ttl=47 time=66.7 ms)并构建一个输出文件(a.csv)。 经过多次尝试,我发现了下面的错误。我的同事给了我他的代码(如下),虽然写得不同,但本质上是一样的。他的代码给出了同样的错误,尽管他的代码在同一个任务中正常工作。
本文向大家介绍C#正则表达式Regex类用法实例分析,包括了C#正则表达式Regex类用法实例分析的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了C#正则表达式Regex类用法,分享给大家供大家参考。具体实现方法如下: 一、在C#中,要使用正则表达式类,请在源文件开头处添加以下语句: 二、RegEx类常用的方法 1、静态Match方法 使用静态Match方法,可以得到源中第一个匹配模式的连
本文向大家介绍Java正则表达式的替换和分组功能,包括了Java正则表达式的替换和分组功能的使用技巧和注意事项,需要的朋友参考一下 前言 这篇来学习正则表达式的替换和分组功能,替换很好理解,分组有点复杂,特别是如何写有效的分组的正则表达式。这篇通过几个练习,简单了解下替换和分组功能。 1.替换功能 在String类有一个替换功能的方法,结合正则表达式去实现替换,下面是replaceAll()方法的
我找不到堆栈溢出的来源,但似乎是外部的循环造成的。 提前道谢!
行动时刻 - 使用正则表达式 Unlang允许在条件检查中进行正则表达式计算。这些通常是Posix正则表达式。运算符=〜和!〜与正则表达式相关联。为了简单的概念证明,我们将修改上一个练习: 1.编辑FreeRADIUS配置目录下的sites-available / default虚拟服务器,并在该部分顶部的post-auth部分中添加以下内容: if(request:Framed-Protocol