我知道使用regex来解析html是不可取的,但这是我想先尝试的解决方案。
我正在努力匹配
这是一个多么好的句子
以及这些单词之间的任何字符或空格
在以下字符串中:
<p>
what is going on with you?
</p>
<p>
what a great
</p>
<p>
sentence this is
</p>
<p>
How is your family?
</p>
我使用的正则表达式是:
what.*a.*great.*sentence.*this.*?is
我知道答案?在'is'阻止我的正则表达式与最后一个p标记中的'How is'匹配之前。但我不知道应该在开头放什么来阻止比赛从第一个p标签的“发生了什么”开始
我正在查看来自https://regex101.com/r/kZWYR7/1验证其是否未按预期工作。
请帮助,我觉得有一个关键的教训,我错过了正则表达式,阻止我解决这个问题。
预期匹配将是:
what a great
</p>
<p>
sentence this is
编辑:澄清我的问题,以及它与副本的不同之处
要将纯文本与正则表达式中字符串的一部分匹配,只需使用您要查找的文本即可。匹配这是一个多么好的句子
应该有用,不需要*
。
*
在允许字符串的其余部分成为任何内容之后,直到
为
。
编辑:我刚刚阅读了你的评论,发现单词之间可能有空格。在这种情况下,@WiktorStribiżew是正确的,在每个单词之间使用
\W*
,以容纳单词之间任何数量的非单词字符。(再次感谢@WiktorStribiżew)
正如@Jonathan Buelow所指出的,如果只是单词之间的空白,你可以使用
\s
或\s*
来代替:这是什么句子
有没有人试图描述与正则表达式匹配的正则表达式? 由于重复的关键字,这个主题几乎不可能在网上找到。 它可能在实际应用程序中不可用,因为支持正则表达式的语言通常具有解析它们的方法,我们可以将其用于验证,以及一种在代码中分隔正则表达式的方法,可用于搜索目的。 但是我仍然想知道匹配所有正则表达式的正则表达式是什么样子的。应该可以写一个。
我一直在研究requirement,需要在以下字符串上创建正则表达式: 该字符串可以有以下多种变体: 在上面的表达式中是一个键名,可以是endDate、updateDate等。这意味着我们不能在表达式中硬编码它。尽管 我使用以下编译模式 模式匹配,但创建的组不是我期望的。我希望下面用括号包围该组: 你能帮我在Java和小组中正确表达吗?
问题内容: 我在Python中使用什么正则表达式来匹配这样的日期:“ 11/12/98”? 问题答案: 与其使用正则表达式,不如将字符串解析为对象通常更好: 然后,您可以访问日,月和年(以及小时,分钟和秒)作为对象的属性: 要测试用正斜杠分隔的数字序列是否表示有效日期,可以使用一个块。无效的日期将引发: 如果您需要搜索更长的字符串以获取日期,则可以使用正则表达式来搜索以正斜杠分隔的数字: 当然,无
我们得到了一些这样的内容:
主要内容:基本模式匹配,字符簇,确定重复出现基本模式匹配 一切从最基本的开始。模式,是正则表达式最基本的元素,它们是一组描述字符串特征的字符。模式可以很简单,由普通的字符串组成,也可以非常复杂,往往用特殊的字符表示一个范围内的字符、重复出现,或表示上下文。例如: 这个模式包含一个特殊的字符 ^,表示该模式只匹配那些以 once 开头的字符串。例如该模式与字符串 "once upon a time" 匹配,与 "There once was
有没有一种方法可以在python中编写与以下格式的字符串匹配的正则表达式: 或 在这里,$=表示零或更多的空白可以存在 :来自字符串的固定子集的字符串['feat','fix','docs','断'] :最大长度为n的字符串 :最大长度为m的字符串 前缀应该始终是一个字符串,之后是一些最大q长度的字母数字字符 注意:我们不能省略像应该使用与下面示例中所示完全相同的格式: feat(feat new