使用 Python 将子列表按另一个列表分组
在 Python 中,我们可以使用多种方法将子列表按另一个列表分组,例如使用字典和使用 itertools.groupby() 函数,以及使用嵌套列表推导式。将子列表按另一个列表分组在分析大型数据集和数据分类时非常有用。它也用于文本分析和自然语言处理。在本文中,我们将探讨在 Python 中使用不同方法将子列表按另一个列表分组,并了解它们的实现。
方法 1:使用字典
字典可以以非常直接的方式用于在 Python 中将子列表按另一个列表分组。让我们通过一个示例来了解使用字典将子列表按另一个列表分组。
语法
list_name.append(element)
这里,元素是要添加到列表末尾的元素。append 方法将此元素放在列表的末尾。
示例
在下面的示例中,我们定义了一个名为 group_sublists 的函数,它接受两个参数:sublists(子列表的列表)和 grouping_list(决定分组顺序的列表)。在函数内部,我们创建了一个空的字典 groups 来存储按其键分组的子列表。我们遍历 sublists 列表中的每个子列表。假设每个子列表的第一个元素是键,我们提取它并检查它是否存在于 groups 字典中。如果存在,我们将当前子列表追加到该键的现有子列表列表中。否则,我们在 groups 字典中创建一个新的键值对,其中键是键,当前子列表是值。最后,我们返回一个列表推导式,该推导式按 grouping_list 指定的顺序检索分组的子列表。
def group_sublists(sublists, grouping_list): groups = {} for sublist in sublists: key = sublist[0] # Assuming the first element of each sublist is the key if key in groups: groups[key].append(sublist) else: groups[key] = [sublist] return [groups[key] for key in grouping_list] # Example usage sublists = [[1, 'apple'], [2, 'banana'], [1, 'orange'], [2, 'grape']] grouping_list = [1, 2] result = group_sublists(sublists, grouping_list) print(result)
输出
[[[1, 'apple'], [1, 'orange']], [[2, 'banana'], [2, 'grape']]]
方法 2:使用 itertools.groupby() 函数
Python 的 itertools 模块提供了一个名为 groupby() 的便捷函数,可用于基于键函数对元素进行分组。让我们通过一个示例来了解这一点。
语法
list_name.append(element)
这里,append() 函数是用于将元素添加到 list_name 末尾的列表方法。它通过将指定的元素作为新项添加到列表中来修改原始列表。
itertools.groupby(iterable, key=None)
这里,iterable 是输入可迭代对象,可以是您要分组的任何序列,并且key=None 是一个可选参数,可以是可以用作分组键的函数。如果未提供键函数,则元素本身将用作分组的键。
示例
在下面的示例中,我们首先根据键(假设它是第一个元素)对子列表进行排序。然后,我们创建一个名为 result 的空列表来存储分组的子列表。接下来,我们遍历 itertools.groupby() 生成的组。groupby() 函数接受两个参数:可迭代对象(在本例中为 sublists)和键函数(一个提取每个子列表键的 lambda 函数)。它返回键和包含分组子列表的迭代器的对。在循环内部,我们检查键是否存在于 grouping_list 中。如果存在,我们使用 list(group) 将迭代器转换为列表并将其追加到 result 列表中。最后,我们返回包含分组子列表的 result 列表。
import itertools def group_sublists(sublists, grouping_list): sublists.sort(key=lambda x: x[0]) # Sort the sublists based on the key result = [] for key, group in itertools.groupby(sublists, lambda x: x[0]): if key in grouping_list: result.append(list(group)) return result # Example usage sublists = [[1, 'apple'], [2, 'banana'], [1, 'orange'], [2, 'grape']] grouping_list = [1, 2] result = group_sublists(sublists, grouping_list) print(result)
输出
[[[1, 'apple'], [1, 'orange']], [[2, 'banana'], [2, 'grape']]]
方法 3:使用嵌套列表推导式
我们可以使用 Python 编写嵌套列表推导式,可用于将子列表按另一个列表分组。让我们看一个示例以了解如何实现这一点。
语法
[expression for item in list if condition]
这里,语法由方括号组成,方括号包含一个表达式,后跟一个迭代列表的 for 循环。任何 if 条件也可以添加到表达式的末尾以过滤掉某些元素。
示例
在下面的示例中,我们定义了函数group_sublists,它将 sublists 和 grouping_list 作为参数。我们使用嵌套列表推导式来遍历 grouping_list 中的每个键。对于每个键,我们遍历子列表并仅过滤出具有匹配键(假设它是第一个元素)的子列表。然后将这些过滤后的子列表收集到一个新列表中,表示该键的分组子列表。结果是一个列表的列表,其中每个子列表包含特定键的分组子列表。
def group_sublists(sublists, grouping_list): return [ [sublist for sublist in sublists if sublist[0] == key] for key in grouping_list ] # Example usage sublists = [[1, 'apple'], [2, 'banana'], [1, 'orange'], [2, 'grape']] grouping_list = [1, 2] result = group_sublists(sublists, grouping_list) print(result)
输出
[[[1, 'apple'], [1, 'orange']], [[2, 'banana'], [2, 'grape']]]
结论
在本文中,我们讨论了如何在 Python 中将子列表按另一个列表分组。我们讨论了三种方法:使用字典和利用 itertools.groupby() 函数,以及使用嵌套列表推导式。每种方法都有其优点,并且根据程序的具体要求可能更适合。