Python - 不可变数据结构



Python 的不可变数据结构是指一旦创建后就无法更改的数据结构。这意味着任何尝试修改数据结构的操作都将导致创建一个新的实例,而不是修改原始实例。不可变数据结构对于确保数据在程序执行过程中保持不变非常有用,这有助于防止错误并使代码更易于理解和维护。

在深入探讨这个主题之前,让我们快速回顾一下什么是数据结构?数据结构是用于组织、处理、检索和存储数据的特殊格式。它们定义了数据在内存中的排列方式以及如何有效地执行诸如访问、插入、删除和更新等操作。

Python 中不同的不可变数据结构

不可变数据结构在 Python 中因其稳定性、线程安全性以及易用性而至关重要。以下是 Python 中不同的不可变数据结构:

  • 元组:这些是有序的项目集合,创建后无法更改。它们可以包含混合数据类型,并且对于表示固定相关的项目集合很有用。
  • 字符串:这些数据结构是字符序列,并且是不可变的。任何修改字符串的操作都将创建一个新的字符串。
  • 冻结集:这些是集合的不可变版本。与普通集合不同,冻结集在创建后不允许修改。
  • 命名元组:这些是元组的子类,具有命名字段,可以提供更具可读性和自文档化的代码。它们像普通元组一样是不可变的。

现在,让我们详细介绍每个不可变数据结构。

元组

Python 中的元组是不可变的元素序列,这意味着一旦创建,它们就无法修改。它们使用括号 '()' 定义,并且可以保存各种项目,例如数字、字符串甚至其他元组。

创建元组

元组使用括号 '()' 创建,元素之间用逗号 ',' 分隔。即使只有一个元素的元组也需要尾随逗号来将其与分组表达式区分开来。

以下是通过将括号 '()' 赋值给变量来创建元组的示例:

empty_tuple = ()
single_element_tuple = (5,)  # Note the comma after the single element
print("Single element tuple:", single_element_tuple)
multi_element_tuple = (1, 2, 'Tutorialspoint', 3.14)
print("Multi elements tuple:", multi_element_tuple)
nested_tuple = (1, (2, 3), 'Learning')
print("Nested tuple:", nested_tuple)

执行上述代码后,我们将得到以下输出

Single element tuple: (5,)
Multi elements tuple: (1, 2, 'Tutorialspoint', 3.14)
Nested tuple: (1, (2, 3), 'Learning')

理解 Python 中元组的不可变性

在这里,我们将了解 Python 中元组的不可变性。以下是一个示例:

# Define a tuple
my_tuple = (1, 2, 3, 'hello')
# Attempt to modify an element (which is not possible with tuples)
# This will raise a TypeError
try:
   my_tuple[0] = 10
except TypeError as e:
   print(f"Error: {e}")
# Even trying to append or extend a tuple will result in an error
try:
   my_tuple.append(4)
except AttributeError as e:
   print(f"Error: {e}")
# Trying to reassign the entire tuple to a new value is also not allowed
try:
   my_tuple = (4, 5, 6)
except TypeError as e:
   print(f"Error: {e}")
print("Original tuple:", my_tuple)

执行上述代码后,我们将得到以下输出

Error: 'tuple' object does not support item assignment
Error: 'tuple' object has no attribute 'append'
Original tuple: (4, 5, 6)

字符串

Python 中的字符串是字符序列,用于表示和操作文本数据。它们用单引号'或双引号"括起来,也可以使用三引号"""来表示多行字符串。

主要特征包括不可变性,即创建后字符串无法更改;有序索引,可以通过位置访问字符;以及支持各种操作,例如连接、切片和迭代。

字符串在 Python 中是基础数据类型,用于文本处理、输入/输出操作以及应用程序中的数据表示,提供了一套功能强大的工具集,以及用于高效操作和格式化文本信息的内置方法。

创建字符串

每种字符串创建方法(即 ', ", """)都有其自身的用例,具体取决于我们是否需要在字符串中包含引号、处理多行文本或在 Python 代码中满足其他特定格式要求。

以下是使用三种引号 ', ", """ 创建字符串的示例:

# Single line string
single_quoted_string = 'Hello, Welcome to Tutorialspoint'

# Double quoted string
double_quoted_string = "Python Programming"

# Triple quoted string for multi-line strings
multi_line_string = """This is a 
multi-line 
string"""

print(single_quoted_string)
print(double_quoted_string)
print(multi_line_string)

执行上述代码后,我们将得到以下输出

Hello, Welcome to Tutorialspoint
Python Programming
This is a
multi-line
string

理解 Python 中的字符串不可变性

通过以下示例,我们将了解 Python 中字符串的不可变性。

# Example demonstrating string immutability
my_string = "Hello"

# Attempting to modify a string will create a new string instead of modifying the original
modified_string = my_string + " Learners"
print(modified_string)  # Output: Hello Learners

# Original string remains unchanged
print(my_string)  # Output: Hello

# Trying to modify the string directly will raise an error
try:
   my_string[0] = 'h'  # TypeError: 'str' object does not support item assignment
except TypeError as e:
   print(f"Error: {e}")

执行上述代码后,我们将得到以下输出

Hello Learners
Hello
Error: 'str' object does not support item assignment

冻结集

Python 中的冻结集是集合的不可变版本。创建后,其元素不能更改、添加或删除。冻结集在我们需要一个在程序执行过程中保持不变的集合的情况下特别有用,尤其是在我们想要将其用作字典的键或另一个集合的元素时。

创建冻结集

我们可以使用frozenset()构造函数创建冻结集,并将可迭代对象(如列表或其他集合)作为参数传递。以下是创建冻结集的示例:

# Creating a frozen set
fset = frozenset([1, 2, 3, 4])

# Printing the frozen set
print(fset)  

执行上述代码后,我们将得到以下输出

frozenset({1, 2, 3, 4})

理解 Python 中冻结集的不可变性

以下示例展示了冻结集的不可变性,以及创建后不允许修改。

# Creating a frozenset
frozen_set = frozenset([1, 2, 3, 4])

# Attempting to add an element to the frozenset will raise an error
try:
   frozen_set.add(5)
except AttributeError as e:
   print(f"Error: {e}")

# Attempting to remove an element from the frozenset will also raise an error
try:
   frozen_set.remove(2)
except AttributeError as e:
   print(f"Error: {e}")

# The original frozenset remains unchanged
print("Original frozenset:", frozen_set)  

执行上述代码后,我们将得到以下输出

Error: 'frozenset' object has no attribute 'add'
Error: 'frozenset' object has no attribute 'remove'
Original frozenset: frozenset({1, 2, 3, 4})

命名元组

Python 中的命名元组是 collections 模块中提供的一种轻量级数据结构,其行为类似于元组,但允许我们使用命名属性以及索引来访问其元素。

它结合了元组的优点(例如不可变、内存效率)以及通过名称引用元素的能力,从而提高了代码的可读性和可维护性。

创建命名元组

我们可以使用 collections 模块中的namedtuple()工厂函数定义命名元组。它接受两个参数:命名元组类型的名称和字段名称的序列(即字符串或字符串的可迭代对象),用于指定其字段的名称。

from collections import namedtuple

# Define a named tuple type 'Point' with fields 'x' and 'y'
Point = namedtuple('Point', ['x', 'y'])

# Create an instance of Point
p1 = Point(1, 2)

# Access elements by index (like a tuple)
print(p1[0])  

# Access elements by name
print(p1.x)   
print(p1.y)   

执行上述代码后,我们将得到以下输出

1
1
2

理解 Python 中命名元组的不可变性

Python 中的命名元组由collections.namedtuple工厂函数提供,确实是不可变的。它们的行为类似于普通元组,但具有命名字段,使其更具可读性和自文档性。

from collections import namedtuple

# Define a named tuple called Point with fields 'x' and 'y'
Point = namedtuple('Point', ['x', 'y'])

# Create an instance of Point
p = Point(x=1, y=2)
print(p)  
# Attempt to modify the named tuple
# This will raise an AttributeError since named tuples are immutable
try:
   p.x = 10
except AttributeError as e:
   print(f"Error occurred: {e}")  

# Accessing elements in a named tuple is similar to accessing elements in a regular tuple
print(p.x) 
print(p.y) 

执行上述代码后,我们将得到以下输出

Point(x=1, y=2)
Error occurred: can't set attribute
1
2
广告