Strings

优质

小牛编辑

147浏览

2023-12-01

字符串是Python中最流行的类型之一。我们可以通过在引号中包含字符来创建它们。 Python将单引号视为双引号。创建字符串就像为变量赋值一样简单。例如 -

var1 = 'Hello World!'
var2 = "Python Programming"

访问字符串中的值

Python不支持字符类型; 这些被视为长度为1的字符串，因此也被视为子字符串。

要访问子字符串，请使用方括号进行切片以及索引或索引以获取子字符串。例如 -

#!/usr/bin/python
var1 = 'Hello World!'
var2 = "Python Programming"
print "var1[0]: ", var1[0]
print "var2[1:5]: ", var2[1:5]

执行上述代码时，会产生以下结果 -

var1[0]:  H
var2[1:5]:  ytho

更新字符串

您可以通过（重新）将变量分配给另一个字符串来“更新”现有字符串。新值可以与其先前的值相关联，也可以与完全不同的字符串相关联。例如 -

#!/usr/bin/python
var1 = 'Hello World!'
print "Updated String :- ", var1[:6] + 'Python'

执行上述代码时，会产生以下结果 -

Updated String :-  Hello Python

逃脱角色

下表是可以使用反斜杠表示法表示的转义或不可打印字符的列表。

转义字符被解释; 在单引号和双引号字符串中。

反斜杠表示法	十六进制字符	描述
\a	0x07	Bell or alert
\b	0x08	Backspace
\cx		Control-x
\C-x		Control-x
\e	0x1b	Escape
\f	0x0c	Formfeed
\M-\C-x		Meta-Control-x
\n	0x0a	Newline
\nnn		八进制表示法，其中n在0.7范围内
\r	0x0d	Carriage return
\s	0x20	Space
\t	0x09	Tab
\v	0x0b	垂直标签
\x		Character x
\xnn		十六进制表示法，其中n在0.9，af或AF范围内

字符串特殊运算符

假设字符串变量a保存'Hello'而变量b保存'Python'，然后 -

操作者	描述	例
+	连接 - 在运算符的任一侧添加值	a + b将给出HelloPython
*	重复 - 创建新字符串，连接同一字符串的多个副本	a * 2会给-HelloHello
[]	切片 - 给出指定索引中的字符	a [1]会给e
[:]	范围切片 - 给出给定范围内的字符	a [1:4]会给出一个
in	Membership - 如果给定字符串中存在字符，则返回true	H在一个意志中给1
not in	Membership - 如果给定字符串中不存在某个字符，则返回true	M不在意志中给1
r/R	原始字符串 - 抑制Escape字符的实际含义。原始字符串的语法与普通字符串的语法完全相同，原始字符串运算符除外，字母“r”在引号之前。 “r”可以是小写（r）或大写（R），并且必须紧接在第一个引号之前。	print r'\ n'打印\ n并打印R'\ n'prints\n
%	格式 - 执行字符串格式	See at next section

字符串格式化运算符

Python最酷的功能之一是字符串格式运算符％。这个操作符对于字符串是唯一的，并且补充了具有C的printf（）系列功能的包。以下是一个简单的例子 -

#!/usr/bin/python
print "My name is %s and weight is %d kg!" % ('Zara', 21)

执行上述代码时，会产生以下结果 -

My name is Zara and weight is 21 kg!

以下是可与％一起使用的完整符号列表 -

格式符号	转变
%c	character
%s	格式化之前通过str（）进行字符串转换
%i	signed decimal integer
%d	signed decimal integer
%u	unsigned decimal integer
%o	八进制整数
%x	十六进制整数（小写字母）
%X	十六进制整数（大写字母）
%e	指数表示法（小写'e'）
%E	指数表示法（使用UPPERcase'E'）
%f	浮点实数
%g	％f和％e中的较短者
%G	％f和％E中的较短者

下表列出了其他支持的符号和功能 -

符号	功能
*	参数指定宽度或精度
-	左对齐
+	display the sign
<sp>	在正数之前留一个空格
#	添加八进制前导零（'0'）或十六进制前导'0x'或'0X'，具体取决于是使用'x'还是'X'。
0	从左边用零填充（而不是空格）
%	'%%'为您留下一个文字'％'
(var)	mapping variable (dictionary arguments)
m.n.	m是最小总宽度，n是小数点后显示的位数（如果应用）

三重行情

Python的三重引号通过允许字符串跨越多行来实现，包括逐字NEWLINE，TAB和任何其他特殊字符。

三引号的语法由三个连续的single or double引号single or double引号组成。

#!/usr/bin/python
para_str = """this is a long string that is made up of
several lines and non-printable characters such as
TAB ( \t ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [ \n ], or just a NEWLINE within
the variable assignment will also show up.
"""
print para_str

执行上述代码时，会产生以下结果。注意每个特殊字符是如何转换为其打印形式的，直到“up”之间字符串末尾的最后一个NEWLINE。并关闭三重报价。另请注意，NEWLINE会出现在行尾的显式回车符或其转义码（\ n） -

this is a long string that is made up of
several lines and non-printable characters such as
TAB (    ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [
 ], or just a NEWLINE within
the variable assignment will also show up.

原始字符串根本不会将反斜杠视为特殊字符。您放入原始字符串的每个字符都保持您编写的方式 -

#!/usr/bin/python
print 'C:\\nowhere'

执行上述代码时，会产生以下结果 -

C:\nowhere

现在让我们使用原始字符串。我们将表达式放在r'expression' ，如下所示 -

#!/usr/bin/python
print r'C:\\nowhere'

执行上述代码时，会产生以下结果 -

C:\\nowhere

Unicode字符串

Python中的普通字符串在内部存储为8位ASCII，而Unicode字符串存储为16位Unicode。这允许更多变化的字符集，包括来自世界上大多数语言的特殊字符。我将限制我对Unicode字符串的处理如下 -

#!/usr/bin/python
print u'Hello, world!'

执行上述代码时，会产生以下结果 -

Hello, world!

如您所见，Unicode字符串使用前缀u，就像原始字符串使用前缀r一样。

内置字符串方法

Python包含以下内置方法来操作字符串 -

Sr.No.	带描述的方法
1	capitalize() 大写首字母串
2	center(width, fillchar) 返回以空格填充的字符串，其中原始字符串以总宽度列为中心。
3	count（str，beg = 0，end = len（string））如果给出起始索引beg和结束索引结束，则计算str在字符串或字符串的子字符串中出现的次数。
4	decode(encoding='UTF-8',errors='strict') 使用为编码注册的编解码器对字符串进行解码。 encoding默认为默认字符串编码。
5	encode(encoding='UTF-8',errors='strict') 返回字符串的编码字符串版本; 出错时，默认是引发ValueError，除非使用'ignore'或'replace'给出错误。
6	endswith(suffix, beg=0, end=len(string)) 确定string的字符串或子字符串（如果给出起始索引beg和结束索引结束）是否以后缀结尾; 如果是，则返回true，否则返回false。
7	expandtabs(tabsize=8) 将字符串中的制表符扩展为多个空格; 如果未提供tabsize，则每个选项卡默认为8个空格。
8	find（str，beg = 0 end = len（string））如果找到起始索引beg和结束索引结束，则确定str是出现在字符串中还是字符串的子字符串中，如果找到则返回索引，否则返回-1。
9	index(str, beg=0, end=len(string)) 与find（）相同，但如果未找到str则引发异常。
10	isalnum() 如果string至少包含1个字符且所有字符都是字母数字，则返回true，否则返回false。
11	isalpha() 如果string至少包含1个字符且所有字符都是字母，则返回true，否则返回false。
12	isdigit() 如果string只包含数字，则返回true，否则返回false。
13	islower() 如果string具有至少1个套管字符且所有套管字符均为小写，则返回true，否则返回false。
14	isnumeric() 如果unicode字符串仅包含数字字符，则返回true，否则返回false。
15	isspace() 如果string只包含空格字符，则返回true，否则返回false。
16	istitle() 如果string被正确“标记”，则返回true，否则返回false。
17	isupper() 如果string至少有一个cased字符且所有cased字符都是大写，则返回true，否则返回false。
18	join(seq) 将序列seq中元素的字符串表示形式（连接）合并为一个字符串，并带有分隔符字符串。
19	len(string) 返回字符串的长度
20	ljust(width[, fillchar]) 返回一个空格填充的字符串，其原始字符串左对齐为总宽度列。
21	lower() 将字符串中的所有大写字母转换为小写。
22	lstrip() 删除字符串中的所有前导空格。
23	maketrans() 返回要在translate函数中使用的转换表。
24	max(str) 返回字符串str中的最大字母字符。
25	min(str) 返回字符串str中的min字母字符。
26	replace(old, new [, max]) 如果给定最大值，则将所有出现的旧字符串替换为新的或最多出现的最大值。
27	rfind(str, beg=0,end=len(string)) 与find（）相同，但在字符串中向后搜索。
28	rindex（str，beg = 0，end = len（string））与index（）相同，但在字符串中向后搜索。
29	rjust(width,[, fillchar]) 返回一个以空格填充的字符串，其原始字符串右对齐为总宽度列。
30	rstrip() 删除字符串的所有尾随空格。
31	split(str="", num=string.count(str)) 根据分隔符str（如果未提供空格）拆分字符串并返回子字符串列表; 如果给出，最多分成多个子串。
32	splitlines（num = string.count（'\ n'））在所有（或num）NEWLINE处拆分字符串，并返回已删除NEWLINE的每行的列表。
33	startswith(str, beg=0,end=len(string)) 确定string的字符串或子字符串（如果给出起始索引beg和结束索引结束）是否以substring str开头; 如果是，则返回true，否则返回false。
34	strip([chars]) 在字符串上执行lstrip（）和rstrip（）。
35	swapcase() 反转字符串中所有字母的大小写。
36	title() 返回字符串的“titlecased”版本，即所有单词都以大写字母开头，其余字母以小写字母开头。
37	translate(table, deletechars="") 根据转换表str（256个字符）转换字符串，删除del字符串中的字符串。
38	upper() 将字符串中的小写字母转换为大写。
39	zfill (width) 返回用零填充的原始字符串到总宽度字符; 对于数字，zfill（）保留给定的任何符号（少于零）。
40	isdecimal() 如果unicode字符串仅包含十进制字符，则返回true，否则返回false。