当前位置: 首页 > 面试题库 >

如何使用正则表达式从python中的字符串中删除标签?(不是HTML)

易炳
2023-03-14
问题内容

我需要从python中的字符串中删除标签。

<FNT name="Century Schoolbook" size="22">Title</FNT>

删除两端的整个标签而只留下“标题”的最有效方法是什么?我只看到了使用HTML标记执行此操作的方法,而这在python中对我没有用。我特别将此用于GIS程序ArcMap。它具有自己的布局元素标签,我只需要删除两个特定标题文本元素的标签。我相信正则表达式可以很好地解决此问题,但是我愿意接受任何其他建议。


问题答案:

这应该工作:

import re
re.sub('<[^>]*>', '', mystring)

所有人都说正则表达式不是这项工作的正确工具:

问题的上下文使得所有与常规/无上下文语言有关的异议均无效。他的语言主要由三个实体:a = <b = >,和c = [^><]+。他想删除任何出现的acb。这相当直接地将他的问题表征为涉及上下文无关文法的问题,并且将其表征为常规语法并不难。

我知道每个人都喜欢“您不能用正则表达式解析HTML”的答案,但是OP不想解析它,他只是想执行一个简单的转换。



 类似资料:
  • 问题内容: 如何在Java中从给定的字符串中删除所有方括号(“ []”)? 在这种情况下将使用什么正则表达式? 问题答案: 使用这个:

  • 问题内容: 我需要删除字符串中的一些子字符串(在大型数据集中)。该 子常常包含特殊字符,像这样的:,^,/,…和 的replaceAll()将它们视为对正则表达式的特殊字符,如点 会匹配任何字符,这是不是我真正想要的东西。 是否有其他函数可以执行“替换”而不将第一个 参数视为正则表达式? 问题答案: 只需使用String.replace()。它的功能相同,但是它 内部处理了特殊字符的转义,以避免您

  • 我有一个文本文件,其中包含以下内容:鲍勃去“商店”商店“买牛奶”买牛奶。 我想删除string1中所有引用的内容,使其只包含:Bob去商店买牛奶。 有没有一种不用正则表达式就能做到这一点的方法?我目前正在尝试使用split()方法。我首先使用split()将文本文件读入名为string1的字符串变量,然后将值存储回名为newString的新字符串中。 我对java非常陌生,不确定是否正确使用了sp

  • 问题内容: 我需要使用正则表达式在单词的 开头 和 结尾 处删除标点符号。似乎正则表达式将是最好的选择。我不想从“ you’re”之类的词中删除标点符号,这就是为什么我不使用.replace()的原因。 问题答案: 您不需要正则表达式即可执行此任务。使用有:

  • 我想删除提供的日期格式字符串的元素-例如通过删除任何非M/y元素将格式“dd/MM/yyyy”转换为“MM/yyyy”。 我尝试做的是基于为该地区提供的现有日/月/年格式创建本地化的月/年格式。 我已经使用正则表达式完成了这项工作,但解决方案似乎比我预期的要长。 示例如下:

  • 问题内容: 如何在Java中使用正则表达式删除字符串中的反斜杠? 例如: 我只想要: 问题答案: 要么 将第一个参数视为正则表达式,因此必须加倍转义反斜杠。 将其视为文字字符串,因此只需将其转义一次。