当前位置: 首页 > 文档资料 > Python 中文教程 >

Strings

优质
小牛编辑
147浏览
2023-12-01

字符串是Python中最流行的类型之一。 我们可以通过在引号中包含字符来创建它们。 Python将单引号视为双引号。 创建字符串就像为变量赋值一样简单。 例如 -

var1 = 'Hello World!'
var2 = "Python Programming"

访问字符串中的值

Python不支持字符类型; 这些被视为长度为1的字符串,因此也被视为子字符串。

要访问子字符串,请使用方括号进行切片以及索引或索引以获取子字符串。 例如 -

#!/usr/bin/python
var1 = 'Hello World!'
var2 = "Python Programming"
print "var1[0]: ", var1[0]
print "var2[1:5]: ", var2[1:5]

执行上述代码时,会产生以下结果 -

var1[0]:  H
var2[1:5]:  ytho

更新字符串

您可以通过(重新)将变量分配给另一个字符串来“更新”现有字符串。 新值可以与其先前的值相关联,也可以与完全不同的字符串相关联。 例如 -

#!/usr/bin/python
var1 = 'Hello World!'
print "Updated String :- ", var1[:6] + 'Python'

执行上述代码时,会产生以下结果 -

Updated String :-  Hello Python

逃脱角色

下表是可以使用反斜杠表示法表示的转义或不可打印字符的列表。

转义字符被解释; 在单引号和双引号字符串中。

反斜杠表示法十六进制字符描述
\a0x07Bell or alert
\b0x08Backspace
\cxControl-x
\C-xControl-x
\e0x1bEscape
\f0x0cFormfeed
\M-\C-xMeta-Control-x
\n0x0aNewline
\nnn八进制表示法,其中n在0.7范围内
\r0x0dCarriage return
\s0x20Space
\t0x09Tab
\v0x0b垂直标签
\xCharacter x
\xnn十六进制表示法,其中n在0.9,af或AF范围内

字符串特殊运算符

假设字符串变量a保存'Hello'而变量b保存'Python',然后 -

操作者描述
+连接 - 在运算符的任一侧添加值a + b将给出HelloPython
*重复 - 创建新字符串,连接同一字符串的多个副本a * 2会给-HelloHello
[]切片 - 给出指定索引中的字符a [1]会给e
[:]范围切片 - 给出给定范围内的字符a [1:4]会给出一个
inMembership - 如果给定字符串中存在字符,则返回trueH在一个意志中给1
not inMembership - 如果给定字符串中不存在某个字符,则返回trueM不在意志中给1
r/R原始字符串 - 抑制Escape字符的实际含义。 原始字符串的语法与普通字符串的语法完全相同,原始字符串运算符除外,字母“r”在引号之前。 “r”可以是小写(r)或大写(R),并且必须紧接在第一个引号之前。print r'\ n'打印\ n并打印R'\ n'prints\n
%格式 - 执行字符串格式See at next section

字符串格式化运算符

Python最酷的功能之一是字符串格式运算符%。 这个操作符对于字符串是唯一的,并且补充了具有C的printf()系列功能的包。 以下是一个简单的例子 -

#!/usr/bin/python
print "My name is %s and weight is %d kg!" % ('Zara', 21)

执行上述代码时,会产生以下结果 -

My name is Zara and weight is 21 kg!

以下是可与%一起使用的完整符号列表 -

格式符号转变
%ccharacter
%s格式化之前通过str()进行字符串转换
%isigned decimal integer
%dsigned decimal integer
%uunsigned decimal integer
%o八进制整数
%x十六进制整数(小写字母)
%X十六进制整数(大写字母)
%e指数表示法(小写'e')
%E指数表示法(使用UPPERcase'E')
%f浮点实数
%g%f和%e中的较短者
%G%f和%E中的较短者

下表列出了其他支持的符号和功能 -

符号功能
*参数指定宽度或精度
-左对齐
+display the sign
<sp>在正数之前留一个空格
#添加八进制前导零('0')或十六进制前导'0x'或'0X',具体取决于是使用'x'还是'X'。
0从左边用零填充(而不是空格)
%'%%'为您留下一个文字'%'
(var)mapping variable (dictionary arguments)
m.n.m是最小总宽度,n是小数点后显示的位数(如果应用)

三重行情

Python的三重引号通过允许字符串跨越多行来实现,包括逐字NEWLINE,TAB和任何其他特殊字符。

三引号的语法由三个连续的single or double引号single or double引号组成。

#!/usr/bin/python
para_str = """this is a long string that is made up of
several lines and non-printable characters such as
TAB ( \t ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [ \n ], or just a NEWLINE within
the variable assignment will also show up.
"""
print para_str

执行上述代码时,会产生以下结果。 注意每个特殊字符是如何转换为其打印形式的,直到“up”之间字符串末尾的最后一个NEWLINE。 并关闭三重报价。 另请注意,NEWLINE会出现在行尾的显式回车符或其转义码(\ n) -

this is a long string that is made up of
several lines and non-printable characters such as
TAB (    ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [
 ], or just a NEWLINE within
the variable assignment will also show up.

原始字符串根本不会将反斜杠视为特殊字符。 您放入原始字符串的每个字符都保持您编写的方式 -

#!/usr/bin/python
print 'C:\\nowhere'

执行上述代码时,会产生以下结果 -

C:\nowhere

现在让我们使用原始字符串。 我们将表达式放在r'expression' ,如下所示 -

#!/usr/bin/python
print r'C:\\nowhere'

执行上述代码时,会产生以下结果 -

C:\\nowhere

Unicode字符串

Python中的普通字符串在内部存储为8位ASCII,而Unicode字符串存储为16位Unicode。 这允许更多变化的字符集,包括来自世界上大多数语言的特殊字符。 我将限制我对Unicode字符串的处理如下 -

#!/usr/bin/python
print u'Hello, world!'

执行上述代码时,会产生以下结果 -

Hello, world!

如您所见,Unicode字符串使用前缀u,就像原始字符串使用前缀r一样。

内置字符串方法

Python包含以下内置方法来操作字符串 -

Sr.No.带描述的方法
1capitalize()

大写首字母串

2center(width, fillchar)

返回以空格填充的字符串,其中原始字符串以总宽度列为中心。

3count(str,beg = 0,end = len(string))

如果给出起始索引beg和结束索引结束,则计算str在字符串或字符串的子字符串中出现的次数。

4decode(encoding='UTF-8',errors='strict')

使用为编码注册的编解码器对字符串进行解码。 encoding默认为默认字符串编码。

5encode(encoding='UTF-8',errors='strict')

返回字符串的编码字符串版本; 出错时,默认是引发ValueError,除非使用'ignore'或'replace'给出错误。

6endswith(suffix, beg=0, end=len(string))

确定string的字符串或子字符串(如果给出起始索引beg和结束索引结束)是否以后缀结尾; 如果是,则返回true,否则返回false。

7expandtabs(tabsize=8)

将字符串中的制表符扩展为多个空格; 如果未提供tabsize,则每个选项卡默认为8个空格。

8find(str,beg = 0 end = len(string))

如果找到起始索引beg和结束索引结束,则确定str是出现在字符串中还是字符串的子字符串中,如果找到则返回索引,否则返回-1。

9index(str, beg=0, end=len(string))

与find()相同,但如果未找到str则引发异常。

10isalnum()

如果string至少包含1个字符且所有字符都是字母数字,则返回true,否则返回false。

11isalpha()

如果string至少包含1个字符且所有字符都是字母,则返回true,否则返回false。

12isdigit()

如果string只包含数字,则返回true,否则返回false。

13islower()

如果string具有至少1个套管字符且所有套管字符均为小写,则返回true,否则返回false。

14isnumeric()

如果unicode字符串仅包含数字字符,则返回true,否则返回false。

15isspace()

如果string只包含空格字符,则返回true,否则返回false。

16istitle()

如果string被正确“标记”,则返回true,否则返回false。

17isupper()

如果string至少有一个cased字符且所有cased字符都是大写,则返回true,否则返回false。

18join(seq)

将序列seq中元素的字符串表示形式(连接)合并为一个字符串,并带有分隔符字符串。

19len(string)

返回字符串的长度

20ljust(width[, fillchar])

返回一个空格填充的字符串,其原始字符串左对齐为总宽度列。

21lower()

将字符串中的所有大写字母转换为小写。

22lstrip()

删除字符串中的所有前导空格。

23maketrans()

返回要在translate函数中使用的转换表。

24max(str)

返回字符串str中的最大字母字符。

25min(str)

返回字符串str中的min字母字符。

26replace(old, new [, max])

如果给定最大值,则将所有出现的旧字符串替换为新的或最多出现的最大值。

27rfind(str, beg=0,end=len(string))

与find()相同,但在字符串中向后搜索。

28rindex(str,beg = 0,end = len(string))

与index()相同,但在字符串中向后搜索。

29rjust(width,[, fillchar])

返回一个以空格填充的字符串,其原始字符串右对齐为总宽度列。

30rstrip()

删除字符串的所有尾随空格。

31split(str="", num=string.count(str))

根据分隔符str(如果未提供空格)拆分字符串并返回子字符串列表; 如果给出,最多分成多个子串。

32splitlines(num = string.count('\ n'))

在所有(或num)NEWLINE处拆分字符串,并返回已删除NEWLINE的每行的列表。

33startswith(str, beg=0,end=len(string))

确定string的字符串或子字符串(如果给出起始索引beg和结束索引结束)是否以substring str开头; 如果是,则返回true,否则返回false。

34strip([chars])

在字符串上执行lstrip()和rstrip()。

35swapcase()

反转字符串中所有字母的大小写。

36title()

返回字符串的“titlecased”版本,即所有单词都以大写字母开头,其余字母以小写字母开头。

37translate(table, deletechars="")

根据转换表str(256个字符)转换字符串,删除del字符串中的字符串。

38upper()

将字符串中的小写字母转换为大写。

39zfill (width)

返回用零填充的原始字符串到总宽度字符; 对于数字,zfill()保留给定的任何符号(少于零)。

40isdecimal()

如果unicode字符串仅包含十进制字符,则返回true,否则返回false。