使用Python进行字符串中的短语提取
在Python中进行短语提取是指从文本上下文中识别有意义的单词的过程。在这个过程中,文本被分割成句子、短语、单词等,并显示这些短语的完整含义。此过程在文本分析、机器学习和供需识别(信息检索)等领域非常有用。
短语提取可用于自然语言处理 (NLP) 任务中,以从句子中分离短语。它有助于识别被称为短语的单词,并可用于翻译、摘要等。
这里有一些短语提取的方法。
方法一
使用列表切片、enumerate()和列表推导式。
这个问题可以通过结合上述技术来解决。在这个方法中,我们提取空格索引,并根据空格索引进行切片。
示例1
string = 'Website Tutorialspoint is best for reading Python and writing.'
# printing original string
print("Original string : " + str(string))
X = 3
# Using list slicing, enumerate(), and list comprehension.
res = [n for n, i in enumerate(string) if i == ' ']
result = string[res[X - 3]: res[-(X - 1)]].strip()
# printing result
print("After Phrase Extraction String : " + str(result))
输出
Original string : Website Tutorialspoint is best for reading Python and writing. After Phrase Extraction String : Tutorialspoint is best for reading Python
在此代码中,首先打印用户提供的原始字符串。然后,我们将一个新变量X设置为3。之后,我们列出字符串中所有空格的位置,并将其存储在一个名为res的变量中。接下来,我们提取从空格列表中移除的数字(比X小3)和大于它的数字(比-(X-1)大)之间的部分。然后,我们清理字符串中的0,并显示已提取的短语。
示例2
string = 'Hi! Welcome in tutorialspoint for reading.'
print("Original string is : " + str(string))
x = 2
# Using list slicing, enumerate(), and list comprehension.
res = [n for n, i in enumerate(string) if i == ' ']
result = string[res[x - 2]: res[-(x - 0)]].strip()
print("After Phrase Extraction String : " + str(result))
输出
Original string is : Hi! Welcome in tutorialspoint for reading. After Phrase Extraction String : Welcome in tutorialspoint
在此代码中,我们首先定义字符串并打印用户定义的原始字符串。然后,我们使用一个名为'x'的新变量,其值为2。之后,我们创建一个变量'res'并列出每个空格的位置。然后,我们必须从字符串中提取一些短语,并将其存储在一个名为'result'的变量中并打印出来。
方法二
使用split()和join()方法。
示例1
string = 'Website Tutorialspoint is best for reading Python.'
# printing original string
print("Original string is : " + str(string))
x = 3
# Using split() and join()
result = ' '.join(string.split()[x:-(x - 2)])
print("After Phrase Extraction String is : " + str(result))
输出
Original string is : Website Tutorialspoint is best for reading Python. After Phrase Extraction String is : best for reading
在此代码中,我们首先初始化字符串并打印出来。然后,我们创建一个值为3的新变量'x'。之后,我们从给定字符串中提取三个起始短语和一个结尾短语,并将它们存储在一个名为'result'的新变量中。最后,我们打印了提取的字符串。
示例2
string = 'Hi! Welcome in tutorialspoint for reading purposes.'
# printing original string
print("Original string is : " + str(string))
x = 4
# Using split() and join()
result = ' '.join(string.split()[x:-(x - 3)])
print("After Phrase Extraction String : " + str(result))
输出
Original string is : Hi! Welcome in tutorialspoint for reading purposes. After Phrase Extraction String : for reading
在此代码中,我们首先初始化字符串并打印出来。然后,我们创建一个值为4的新变量'x'。之后,我们从给定字符串中提取四个起始短语和一个结尾短语,并将它们存储在一个名为'result'的新变量中。最后,我们打印了提取的字符串。
结论
总之,我们已经看到,使用Python从字符串中提取短语是一个可行且安全的过程。我们提供了有关如何使用不同技术执行此任务的指导。当我们需要识别和引用特征时,提取短语可能非常重要。借助Python,我们可以轻松地从字符串中提取短语并在项目中使用它们。此过程中可以使用大多数规则、技术和应用程序,我们可以根据您的需求进行调整。因此,使用Python从字符串中提取短语是一项有用的技能,您可以将其添加到您的编码技能中。
数据结构
网络
关系数据库管理系统 (RDBMS)
操作系统
Java
iOS
HTML
CSS
Android
Python
C语言编程
C++
C#
MongoDB
MySQL
Javascript
PHP