Python程序提取网格匹配字符串

模式识别是一个重要的编程概念。它允许我们检索满足特定条件或匹配特定序列的特定数据。这一原理在包括语言和图像处理在内的各个领域都很有帮助。字符串匹配帮助我们从大量数据中提取有意义的信息。

在本文中，我们将讨论一个类似的概念，即从给定的字符串列表中提取网格匹配字符串。网格匹配侧重于提取长度相等的“相似”字符串，让我们详细讨论这个问题。

理解问题

主要概念是提取遵循特定模式的相似字符串。网格字符串包含缺失的字符，并且应该提取与网格隐藏模式匹配的字符串。让我们借助示例来理解这一点。

输入输出场景

Input:
lis1 = ["Suresh", "Ramesh", "Ravi", "Raghav"]
mesh = "___e_h"

网格包含字母“e”和“h”以及一些形成模式的缺失字符。我们必须从与网格模式匹配的列表中提取字符串。

Output: ['Suresh', 'Ramesh']

显然，“Suresh”和“Ramesh”与网格模式匹配。现在我们已经理解了问题陈述，让我们讨论一些解决方案。

使用迭代以及Zip()

在传递字符串列表和网格模式后，我们将创建一个空列表以存储提取的字符串。我们将使用“for”循环迭代每个字符串，并在循环内建立一个条件，该条件检查当前“string”（单词）的长度是否等于网格的长度。

这使我们能够选择与网格匹配的相关字符串。该条件还检查网格中的字符是否为“下划线”或它是否与单词中相应的字符匹配。

使用这两个条件，我们将提取与网格模式匹配的单词。如果两个字符串及其字符都满足条件，则将使用zip()函数迭代并配对来自“mesh”的字符和“words”的字符。此函数允许在两个模式之间进行成对比较。

示例

以下是提取网格匹配字符串的示例：

lis1 = ["Suresh", "Ramesh", "Ravi", "Raghav"]
mesh = "___e_h"
lis2 = []
print(f"The original list is: {lis1}")

for words in lis1:
   if (len(words) == len(mesh)) and all((letter1 == "_") or (letter1 == letter2)
      for letter1, letter2 in zip(mesh, words)):
         lis2.append(words)

print(f"The new list is: {lis2}")

输出

The original list is: ['Suresh', 'Ramesh', 'Ravi', 'Raghav']
The new list is: ['Suresh', 'Ramesh']

使用列表推导式

在这种方法中，我们将使用列表推导式的技术来生成一个细致且紧凑的代码。迭代的多行概念可以总结为几行代码。

这种紧凑的表示增强了程序的可读性。我们将使用相同的逻辑来建立条件并分离符合条件的值。将“for”和“if”循环应用于列表中。每个字符都通过zip()函数进行比较和配对。

示例

以下是一个示例：

lis1 = ["Suresh", "Ramesh", "Ravi", "Raghav"]
mesh = "___e_h"
print(f"The original list is:{lis1}")

lis2 = [words for words in lis1 if (len(words) == len(mesh)) and all((letter1 == "_") or (letter1 == letter2)
           for letter1, letter2 in zip(mesh, words))]

print(f"The new list is: {lis2}")

输出

The original list is:['Suresh', 'Ramesh', 'Ravi', 'Raghav']
The new list is: ['Suresh', 'Ramesh']

使用Filter() + Lambda()函数

Filter函数可用于根据某些条件过滤值。在提供网格模式和字符串列表后，我们将使用filter()和lambda函数创建一个新列表。filter函数将过滤掉不匹配的字符串，并在其中定义一个lambda函数，我们将检查两个模式的长度。

zip()函数将用于比较和配对字符。过滤条件将由lambda函数提供。

示例

以下是一个示例：

lis1 = ["Suresh", "Ramesh", "Ravi", "Raghav"]
mesh = "___e_h"
print(f"The original list is:{lis1}")

lis2 = list(filter(lambda words: len(words) == len(mesh) and all((letter1 == "_") or (letter1 == letter2)
   for letter1, letter2 in zip(mesh, words)), lis1))
print(f"The new list is: {lis2}")

输出

The original list is:['Suresh', 'Ramesh', 'Ravi', 'Raghav']
The new list is: ['Suresh', 'Ramesh']

宝贵见解

上面讨论的所有解决方案都遵循一个核心原则：为了比较字符串和网格模式，它们的长度应该相等，即字符串和网格应该具有相同数量的字符。此外，如果下划线的位移发生变化，则模式识别也会发生变化。

结论

在本文中，我们讨论了几个多产且有效的解决方案来提取网格匹配字符串。最初我们专注于理解网格匹配的概念，然后我们介绍了解决方案。我们应用了许多编程概念，包括“迭代”、“列表推导式”、“filter()”和“lambda函数”来实现我们的目标。

Devesh Chauhan

更新于： 2023年7月12日

81 次查看

开启您的职业生涯

通过完成课程获得认证

开始学习