Python 字符串切片



Python **字符串切片**是从给定字符串创建子字符串的一种方法。在这个过程中,我们提取字符串的一部分或片段。通常,我们使用切片运算符“[ : ]”对 Python 字符串进行切片。在继续进行字符串切片之前,让我们了解一下字符串索引。

在 Python 中,一个 字符串 是一个有序的 Unicode 字符 序列。字符串中的每个字符在序列中都有一个唯一的索引。索引从 0 开始。字符串中的第一个字符的索引为 0。索引不断递增到字符串的末尾。

如果一个字符串变量声明为 var="HELLO PYTHON",则字符串中每个字符的索引如下:

string index representation

Python 字符串索引

Python 允许您通过其索引访问字符串中的任何单个字符。在这种情况下,0 是字符串的下界,11 是字符串的上界。因此,var[0] 返回 H,var[6] 返回 P。如果方括号中的索引超过上界,Python 将引发 IndexError。

示例

在下面的示例中,我们通过索引访问字符串的字符。

var = "HELLO PYTHON"
print(var[0]) 
print(var[7])  
print(var[11])  
print(var[12]) 

运行代码后,将产生以下输出:

H
Y
N
ERROR!
Traceback (most recent call last):
  File "<main.py>", line 5, in <module>
IndexError: string index out of range

Python 字符串负索引和正索引

Python 序列类型(因此也是字符串对象)的独特特性之一是它也具有负索引方案。在上面的示例中,使用了正索引方案,其中索引从左到右递增。在负索引的情况下,末尾的字符具有 -1 索引,索引从右到左递减,因此第一个字符 H 的索引为 -12。

positive negative indexing

示例

让我们使用负索引来获取 N、Y 和 H 字符。

var = "HELLO PYTHON"
print(var[-1]) 
print(var[-5])  
print(var[-12])  

执行上述代码后,将得到以下结果:

N
Y
H

因此,我们可以使用正索引或负索引从字符串中检索字符。

在 Python 中,字符串是一个不可变对象。如果对象一旦存储在某个内存位置就不能就地修改,则该对象是不可变的。您可以使用索引检索字符串中的任何字符,但不能将其替换为另一个字符。

示例

在下面的示例中,字符 Y 在 HELLO PYTHON 中的索引为 7。尝试将 Y 替换为 y,看看会发生什么。

var="HELLO PYTHON"
var[7]="y"
print (var)

它将产生以下**输出**:

Traceback (most recent call last):
 File "C:\Users\users\example.py", line 2, in <module>
  var[7]="y"
  ~~~^^^
TypeError: 'str' object does not support item assignment

TypeError 是因为字符串是不可变的。

Python 字符串切片

Python 将 ":" 定义为字符串切片运算符。它从原始字符串返回一个子字符串。其一般用法如下:

substr=var[x:y]

":" 运算符需要两个整数操作数(两者都可以省略,我们将在后续示例中看到)。第一个操作数 x 是所需切片第一个字符的索引。第二个操作数 y 是所需字符串中最后一个字符之后一个字符的索引。因此,`var[x:y]` 将从原始字符串中分离从第 x 个位置到第 (y-1) 个位置的字符。

示例

var="HELLO PYTHON"

print ("var:",var)
print ("var[3:8]:", var[3:8])

它将产生以下**输出**:

var: HELLO PYTHON
var[3:8]: LO PY

Python 字符串切片与负索引

与正索引一样,负索引也可以用于切片。

示例

以下示例显示了如何使用负索引切片字符串。

var="HELLO PYTHON"
print ("var:",var)
print ("var[3:8]:", var[3:8])
print ("var[-9:-4]:", var[-9:-4])

它将产生以下**输出**:

var: HELLO PYTHON
var[3:8]: LO PY
var[-9:-4]: LO PY

字符串切片中索引的默认值

Python 的切片运算符的两个操作数都是可选的。第一个操作数默认为零,这意味着如果我们不提供第一个操作数,则切片从第 0 个索引处的字符开始,即第一个字符。它将最左边的子字符串切片到“y-1”个字符。

示例

在这个例子中,我们使用默认值执行切片操作。

var="HELLO PYTHON"
print ("var:",var)
print ("var[0:5]:", var[0:5])
print ("var[:5]:", var[:5])

它将产生以下**输出**:

var: HELLO PYTHON
var[0:5]: HELLO
var[:5]: HELLO

示例

同样,y 操作数也是可选的。默认情况下,它是“-1”,这意味着字符串将从第 x 个位置切片到字符串的末尾。

var="HELLO PYTHON"
print ("var:",var)
print ("var[6:12]:", var[6:12])
print ("var[6:]:", var[6:])

它将产生以下输出:

var: HELLO PYTHON
var[6:12]: PYTHON
var[6:]: PYTHON

示例

当然,如果两个操作数都不使用,则切片将等于原始字符串。这是因为“x”默认为 0,“y”默认为最后一个索引+1(或 -1)。

var="HELLO PYTHON"
print ("var:",var)
print ("var[0:12]:", var[0:12])
print ("var[:]:", var[:])

它将产生以下**输出**:

var: HELLO PYTHON
var[0:12]: HELLO PYTHON
var[:]: HELLO PYTHON

示例

为了获得原始字符串的子字符串,左操作数必须小于右操作数。如果左操作数大于右操作数,Python 不会引发任何错误,而是返回一个空字符串。

var="HELLO PYTHON"
print ("var:",var)
print ("var[-1:7]:", var[-1:7])
print ("var[7:0]:", var[7:0])

它将产生以下**输出**:

var: HELLO PYTHON
var[-1:7]:
var[7:0]:

字符串切片的返回类型

切片返回一个新的字符串。您可以很好地在切片字符串上执行字符串操作,例如连接或切片。

示例

var="HELLO PYTHON"

print ("var:",var)
print ("var[:6][:2]:", var[:6][:2])

var1=var[:6]
print ("slice:", var1)
print ("var1[:2]:", var1[:2])

它将产生以下**输出**:

var: HELLO PYTHON
var[:6][:2]: HE
slice: HELLO
var1[:2]: HE
广告