当前位置: 首页 > 面试题库 >

使用Python删除子字符串

狄宗清
2023-03-14
问题内容

我已经从论坛中提取了一些信息。这是我现在拥有的原始字符串:

string = 'i think mabe 124 + <font color="black"><font face="Times New Roman">but I don\'t have a big experience it just how I see it in my eyes <font color="green"><font face="Arial">fun stuff'

我不喜欢的是子字符串"<font color="black"><font face="Times New Roman">""<font color="green"><font face="Arial">"。我确实想保留字符串的其他部分,除此之外。所以结果应该是这样的

resultString = "i think mabe 124 + but I don't have a big experience it just how I see it in my eyes fun stuff"

我该怎么办?实际上,我使用漂亮的汤从论坛中提取了上面的字符串。现在,我可能更喜欢使用正则表达式删除该部分。


问题答案:
import re
re.sub('<.*?>', '', string)
"i think mabe 124 + but I don't have a big experience it just how I see it in my eyes fun stuff"

re.sub函数采用常规表达式,并将字符串中的所有匹配项替换为第二个参数。在这种情况下,我们正在搜索所有标签'<.*?>'),然后将其替换为('')。

?用于在re非贪婪的搜索。

有关的更多信息re module



 类似资料:
  • 问题内容: 例如,有一个字符串。。 如何从中删除中间字符M?我不需要代码。我想知道: Python中的字符串是否以任何特殊字符结尾? 哪种更好的方法-从中间字符或创建新字符串开始,将所有内容从右移到左,而不是复制中间字符? 问题答案: 在Python中,字符串是不可变的,因此你必须创建一个新字符串。你有一些关于如何创建新字符串的选项。如果要删除出现的,请执行以下操作: 如果要删除中心字符: 你询问

  • 问题内容: 我有一个存储在数据库中的HTML字符串。不幸的是,它包含诸如®的字符,我想在数据库本身中或在我的Python / Django代码中使用“查找替换”将它们替换为HTML等效字符。 关于如何执行此操作的任何建议? 问题答案: 你可以使用ASCII字符为前128个字符,因此获取每个字符的编号,如果超出范围则将其删除 结果 请注意,@其中包括了它,因为毕竟它是一个ASCII字符。如果要剥离特

  • 问题内容: 我是Python和RegEx的初学者,我想知道如何制作一个带符号的字符串并将其替换为空格。任何帮助都很棒。 例如: 变成: 问题答案: 一种使用正则表达式的方式: 将匹配字母数字字符和下划线 将匹配任何 非 字母数字或下划线的内容

  • 问题内容: 如何从字符串中删除除数字以外的所有字符? 问题答案: 在Python 2. *中,到目前为止最快的方法是: 生成一个转换表(长度为256的字符串),在这种情况下,该转换表与(更快地制作;-)相同。应用转换表(这里无关紧要,因为本质上是指身份),并删除第二个参数(关键部分)中存在的字符。 在Unicode字符串(和Python 3中的字符串)上的工作方式大不相同-我 确实 希望指出问题是

  • 问题内容: 我有以下代码: 我期望: 我有: 现在我做 有没有更好的办法? 问题答案: 并不意味着“删除此子字符串”。视为一组字符,并从的两端去除该组中的所有字符。 在 Python 3.9及更高版本上, 您可以使用和方法从字符串的任一侧删除整个子字符串: 相关的Python增强建议是PEP-616。 在 Python 3.8及更早版本上, 您可以使用和切片: 或正则表达式:

  • 问题内容: 使用Java等同于s 的字符串需要发生什么 假设它来自我正在读取的文件。 问题答案: Java无法正确处理BOM。实际上,Java像处理其他所有char一样处理BOM。 发现了这一点: http://www.rgagnon.com/javadetails/java-handle-utf8-file-with- bom.html 可能是我改用apache IO: http://commo