Python程序将字符串分割成多个子字符串


在Python中,我们可以使用split()方法将字符串分割成子字符串。split()方法是Python内置的字符串方法之一,它根据指定的分割符将字符串分割成子字符串列表。在本文中,我们将学习如何通过示例来将字符串分割成子字符串。

将字符串分割成子字符串

方法一:使用split()方法

split()方法是Python中字符串的内置方法,它根据指定的分割符将字符串分割成子字符串列表。分割符可以是任何字符或字符串,用于分隔子字符串。split()方法接受一个参数,即分割符。如果没有指定分割符,它将把字符串分割成单个字符。

示例:分别基于空格和逗号分隔符进行分割

在下面的示例中,我们将使用空格分隔符分割字符串。我们使用split()方法并传入空格分隔符,以便根据空格分割字符串。

string = "Hello World"
substrings = string.split()
print(substrings)

string1 = "apple,banana,orange"
substrings = string1.split(",")
print(substrings)

输出

['Hello', 'World']
['apple', 'banana', 'orange']

示例:使用正则表达式分割

在下面的示例中,我们使用了正则表达式模块中的split()函数,使用短横线和空格分隔符将字符串“23-456-7890”分割成三个子字符串。

import re

string = "123-456-7890"
substrings = re.split("-|\s", string)
print(substrings)

输出

['123', '456', '7890']

方法二:使用列表推导式

列表推导式是Python中创建列表的一种简洁方法。它允许你基于现有列表或其他可迭代对象创建一个新列表,同时应用过滤条件并对可迭代对象的元素进行转换。

语法

new_list = [expression for item in iterable if condition]

其中,“表达式”是对可迭代对象每个元素要执行的转换或操作,“项目”是正在处理的当前元素,“可迭代对象”是元素的来源,“条件”是一个可选的过滤条件,用于确定是否将元素包含在结果列表中。

示例

在下面的示例中,我们从一个名为“sentence”的字符串开始,该字符串包含一系列用空格分隔的单词。我们使用split()方法将字符串分割成单词列表,然后使用列表推导式创建一个名为“words”的新列表,其中包含原始字符串中的每个单词。

sentence = "The quick brown fox jumps over the lazy dog"
words = [word for word in sentence.split()]
print(words)

输出

['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']

方法三:使用partition()方法

partition()方法是Python中字符串的内置方法,它根据指定的分割符将字符串分割成三个部分。它返回一个元组,其中包含分割符之前的字符串左部分、分割符本身以及分割符之后的字符串右部分。如果在字符串中找不到分割符,则该方法返回一个元组,其中包含原始字符串,后跟两个空字符串。

语法

string.partition(delimiter)

这里,字符串是要分割的字符串,而分隔符是根据它要进行分割的字符串的分隔符。

示例

在下面的示例中,我们使用partition()方法根据空格分隔符将字符串“Hello World!”分割成三个部分。结果元组包含左部分“Hello”、分隔符“ ”和右部分“World!”。

string = "Hello World!"
parts = string.partition(" ")
print(parts)

输出

('Hello', ' ', 'World!')

方法四:使用splitlines()函数

splitlines()方法是Python中字符串的内置方法,它根据换行符“\n”将字符串分割成行列表。如果字符串不包含任何换行符,则它返回一个列表,其中包含原始字符串作为其唯一元素。

语法

string.splitlines()

这里,splitlines()不接受任何参数,总是根据换行符进行分割。

示例

在下面的示例中,我们使用splitlines()方法将字符串“Line 1\nLine 2\nLine 3”分割成行列表。结果列表包含三个元素,原始字符串中的每一行一个。

string = "Line 1\nLine 2\nLine 3"
lines = string.splitlines()
print(lines)

输出

['Line 1', 'Line 2', 'Line 3']

方法五:使用re.findall()方法

re.findall()方法是Python中re模块中的一个函数,它搜索字符串中指定正则表达式模式的所有出现,并返回所有匹配项的列表。正则表达式模式可以包含表示不同类型字符或序列的各种字符,允许进行复杂的模式匹配和提取字符串的特定部分。

语法

re.findall(regular_expression, string)

这里,re.findall()方法接受一个正则表达式,用于查找从也传递给findall()函数的字符串中匹配单词的出现。

示例

在下面的示例中,我们使用re.findall()方法搜索字符串中\b\w{5}\b正则表达式模式的所有出现。此模式匹配任何正好由五个单词字符(字母、数字或下划线)组成的序列,该序列由单词边界(即单词的开头或结尾)包围。re.findall()方法返回在字符串中找到的所有匹配项的列表。

import re

string = "The quick brown fox jumps over the lazy dog"
matches = re.findall(r"\b\w{5}\b", string)
print(matches)

输出

['quick', 'brown', 'jumps']

结论

在本文中,我们讨论了如何使用split()函数、列表推导式、partition方法、splitlines方法和re.findall()方法在Python中将字符串分割成多个子字符串。split()函数接受分隔符作为参数。然后根据该分隔符分割字符串。splitlines方法总是根据换行符进行分割。我们可以根据想要进行的分割类型使用本文中解释的任何方法。

更新于:2023年7月11日

浏览量:135

开启你的职业生涯

通过完成课程获得认证

开始学习
广告
© . All rights reserved.