自然语言工具包 - 入门



为了安装NLTK,我们必须在我们的计算机上安装Python。您可以访问链接www.python.org/downloads并选择适合您操作系统的最新版本,例如Windows、Mac和Linux/Unix。有关Python的基本教程,您可以参考链接www.tutorialspoint.com/python3/index.htm

Install Natural Language Toolkit

现在,一旦您在计算机系统上安装了Python,让我们了解如何安装NLTK。

安装NLTK

我们可以在不同的操作系统上安装NLTK,如下所示:

在Windows上

为了在Windows操作系统上安装NLTK,请按照以下步骤操作:

  • 首先,打开Windows命令提示符并导航到pip文件夹的位置。

  • 接下来,输入以下命令来安装NLTK:

pip3 install nltk

现在,从Windows开始菜单打开PythonShell,并输入以下命令以验证NLTK的安装:

Import nltk

如果您没有收到任何错误,则表示您已成功在安装了Python3的Windows操作系统上安装了NLTK。

在Mac/Linux上

为了在Mac/Linux操作系统上安装NLTK,请写入以下命令:

sudo pip install -U nltk

如果您在计算机上没有安装pip,则请按照以下说明首先安装pip

首先,使用以下命令更新软件包索引:

sudo apt update

现在,输入以下命令以安装python 3的pip

sudo apt install python3-pip

通过Anaconda

为了通过Anaconda安装NLTK,请按照以下步骤操作:

首先,要安装Anaconda,请访问链接https://anaconda.net.cn/download,然后选择您需要安装的Python版本。

Anaconda

一旦您在计算机系统上安装了Anaconda,请转到其命令提示符并写入以下命令:

conda install -c anaconda nltk
Anaconda Command

您需要查看输出并输入“yes”。NLTK将被下载并安装到您的Anaconda软件包中。

下载NLTK的数据集和包

现在我们已经在计算机上安装了NLTK,但是为了使用它,我们需要下载其中可用的数据集(语料库)。一些可用的重要数据集包括stpwords、gutenberg、framenet_v15等等。

借助以下命令,我们可以下载所有NLTK数据集:

import nltk
nltk.download()
Natural Language Toolkit Datasets

您将获得以下已下载的NLTK窗口。

Natural Language Toolkit Download

现在,单击下载按钮以下载数据集。

如何运行NLTK脚本?

以下是一个示例,其中我们使用PorterStemmer nltk类实现了Porter词干提取算法。通过此示例,您将能够了解如何运行NLTK脚本。

首先,我们需要导入自然语言工具包(nltk)。

import nltk

现在,导入PorterStemmer类以实现Porter词干提取算法。

from nltk.stem import PorterStemmer

接下来,创建Porter Stemmer类的实例,如下所示:

word_stemmer = PorterStemmer()

现在,输入您想要进行词干提取的单词。

word_stemmer.stem('writing')

输出

'write'

word_stemmer.stem('eating')

输出

'eat'
广告