当前位置：首页 > 面试题库 >

正则表达式以匹配结束的HTML标签

盖和洽

2023-03-14

问题内容：

我正在研究一个小的Python脚本来清理HTML文档。它的工作方式是接受KEEP的标签列表，然后解析不在列表中的HTML代码，破坏标签我一直在使用正则表达式来做到这一点，而且我已经能够匹配开始标签和自动关闭标签但不关闭标签。

我一直在尝试匹配结束标记的模式是</(?!a)>。在我看来这是合乎逻辑的，所以为什么不起作用？本(?!a)应匹配任何不是一个锚定标记（不就是“a”是可以anything
–这只是一个例子）。

编辑：AGG！我猜正则表达式没有显示！

问题答案：

读：
- RegEx匹配除XHTML自包含标签之外的其他打开标签
- 您能否提供一些示例，说明为什么用正则表达式很难解析XML和HTML？
- 悔改。
使用真正的HTML解析器，例如BeautifulSoup。

类似资料：

php正则表达式以匹配html标签之外

问题内容：我在html页面上制作了preg_replace。我的模式旨在为html中的某些单词添加周围的标记。但是，有时我的正则表达式会修改html标签。例如，当我尝试替换此文本时：这样读，我的正则表达式也锚标记的alt属性取代亚萨尔。当前我正在使用的外观如下：如何制作正则表达式，使其与html标记内的任何内容都不匹配？问题答案：您可以为此使用断言，因为您只需要确保搜索到的单词出现在或之
与正则表达式匹配的正则表达式

有没有人试图描述与正则表达式匹配的正则表达式？由于重复的关键字，这个主题几乎不可能在网上找到。它可能在实际应用程序中不可用，因为支持正则表达式的语言通常具有解析它们的方法，我们可以将其用于验证，以及一种在代码中分隔正则表达式的方法，可用于搜索目的。但是我仍然想知道匹配所有正则表达式的正则表达式是什么样子的。应该可以写一个。
PHP正则表达式以匹配HTML标签之外的关键字

问题内容：我一直在尝试做一个正则表达式来匹配和替换HTML一部分上关键字的出现：我想匹配和但是并且不应该匹配我只对第一行的匹配（和替换）感兴趣。我想要此操作的原因是将其替换为，但仅当它尚未位于标记中时才可以。任何帮助都感激不尽！问题答案：我设法通过以下方式完成了我想做的事情（不使用Regex ）：解析字符串的每个字符删除所有标签（将它们复制到临时数组并在字符串上保留占位符）
>>正则表达式匹配

我们得到了一些这样的内容：
PHP正则表达式以匹配HTML标记之外的关键字

问题内容：我一直在尝试做一个正则表达式来匹配和替换HTML一部分上关键字的出现：我想匹配和但是并且不应该匹配我只对第一行的匹配（和替换）感兴趣。我想要这样做的原因是要替换为，但前提是它尚未位于标记内。任何帮助都感激不尽！问题答案：我设法通过以下方式完成了我想做的事情（不使用Regex ）：解析字符串的每个字符删除所有标签（将它们复制到临时数组并在字符串上保留占位符）新字符串
正则表达式 - 匹配规则

主要内容：基本模式匹配,字符簇,确定重复出现基本模式匹配一切从最基本的开始。模式，是正则表达式最基本的元素，它们是一组描述字符串特征的字符。模式可以很简单，由普通的字符串组成，也可以非常复杂，往往用特殊的字符表示一个范围内的字符、重复出现，或表示上下文。例如：这个模式包含一个特殊的字符 ^，表示该模式只匹配那些以 once 开头的字符串。例如该模式与字符串 "once upon a time" 匹配，与 "There once was

正则表达式以匹配结束的HTML标签

相关阅读

相关文章

相关问答

相关工具

相关文档