我正在尝试使用Python从字符串中删除特定字符。这是我现在正在使用的代码。不幸的是,它似乎对字符串没有任何作用。
for char in line:
if char in " ?.!/;:":
line.replace(char,'')
如何正确执行此操作?
Python中的字符串是不可变的(无法更改)。因此,的效果line.replace(...)
只是创建一个新字符串,而不是更改旧字符串。你需要重新绑定(分配)到line该变量,以使该变量采用新值,并删除这些字符。
而且,相对而言,你的操作方式会比较缓慢。这也可能会使经验丰富的pythonator感到有些困惑,他们将看到双重嵌套的结构,并暂时认为会发生一些更复杂的事情。
从Python 2.6和更高版本的Python 2.x版本*开始,你可以改用str.translate
,(但请继续阅读Python 3的不同之处):
line = line.translate(None, '!@#$')
或用替换正则表达式 re.sub
import re
line = re.sub('[!@#$]', '', line)
方括号内的字符构成一个字符类。line该类中的所有字符都将替换为第二个参数sub:空字符串。
在Python 3中,字符串是Unicode
。你必须进行一些不同的翻译。kevpie在对其中一个答案的评论中提到了这一点,并在的文档中str.translate
对此进行了注明。
当调用translateUnicode
字符串的方法时,你不能传递上面使用的第二个参数。你也不能None作为第一个参数传递。相反,你将翻译表(通常是字典)作为唯一参数传递。该表将字符的序号值(即调用ord它们的结果)映射到应替换它们的字符的序号值,或者(对我们有用)None表示应删除它们。
因此,使用Unicode字符串进行上述舞蹈时,你会调用类似
translation_table = dict.fromkeys(map(ord, '!@#$'), None)
unicode_line = unicode_line.translate(translation_table)
在此处dict.fromkeys
和map用于简要生成包含以下内容的字典
{ord('!'): None, ord('@'): None, ...}
就像另一个答案所说的那样,它更简单,在原位创建翻译表:
unicode_line = unicode_line.translate({ord(c): None for c in '!@#$'})
或使用创建相同的翻译表str.maketrans
:
unicode_line = unicode_line.translate(str.maketrans('', '', '!@#$'))
*
为了与早期的Python兼容,你可以创建一个“空”转换表来代替None
:
import string
line = line.translate(string.maketrans('', ''), '!@#$')
这string.maketrans
是用来创建转换表的,它只是一个字符串,其中包含序号为0到255的字符。
问题内容: 我有一个像这样的数组: 我要做的是删除“苹果”。 我的问题很基本,但是,我搜索了网站,发现java并不真正支持从数组中删除功能。我还听说过使用Java Utils,因为删除项目非常简单…。我试图在Google上找到Java Utils,但是几乎所有链接都消失了。 所以最后…有什么方法可以从字符串数组中删除字符串? 即使我使用ArrayList,也找不到在其中生成随机项的方法!例如:在普
问题内容: 例如,我正在从文本文件中提取文本String,我需要这些词来形成数组。但是,当我执行所有这些操作时,有些单词以逗号(,)或句号(。)结尾,甚至附有括号(这完全是正常现象)。 我要做的是摆脱那些角色。我一直在尝试使用Java中的预定义String方法来做到这一点,但我还是无法解决。 问题答案: 用: replaceAll采用正则表达式。这个: …寻找每个逗号和/或句号。
问题内容: 我需要从下面的变量值中删除括号“ [”和“]” ,并将结果存储在中。 使用,还是其他? 问题答案: 有几种可用的方法,有时可以使它们执行完全相同的任务,例如preg_replace / str_replace。但是,也许您只想从字符串的开头或结尾删除方括号;在这种情况下,preg_replace有效。但是,如果可能有多个括号,则preg_replace也可以完成这项工作。但是修剪更容易
问题内容: 我有一组字符串,并且其中的所有字符串都有两个特定的子字符串,这些子字符串是我不需要的并且想要删除。 输入示例: 所以基本上我希望从所有字符串中删除和子字符串。 我试过的 但这似乎根本不起作用。输出绝对没有变化,它与输入相同。我尝试使用原始版本,但没有任何改变。 问题答案: 字符串是不可变的。(python 2.x)或(python 3.x)创建一个 新 字符串。在文档中对此进行了说明:
我正在通过JSON提取twitter用户的个人资料图像。为此,我的代码是: 返回配置文件图像的url。url的格式可以是或或或等。 现在我想从我收到的每个网址中删除“_normal”部分。如何在php中实现这一点?我厌倦了尝试它。请帮助。
问题内容: 我有一个程序可以从Twitter流API实时解析推文。在存储它们之前,我将它们编码为utf8。某些字符最终以?,??或???出现在字符串中 而不是它们各自的unicode代码,并且会引起问题。经过进一步调查,我发现有问题的字符来自“表情符号”块 U + 1F600-U + 1F64F和“其他符号和象形文字”块 U + 1F300-U + 1F5FF。我尝试删除,但未成功,因为匹配器最终