- Gensim 教程
- Gensim - 首页
- Gensim - 简介
- Gensim - 入门指南
- Gensim - 文档与语料库
- Gensim - 向量与模型
- Gensim - 创建词典
- 创建词袋(BoW)语料库
- Gensim - 变换
- Gensim - 创建 TF-IDF 矩阵
- Gensim - 主题建模
- Gensim - 创建 LDA 主题模型
- Gensim - 使用 LDA 主题模型
- Gensim - 创建 LDA Mallet 模型
- Gensim - 文档与 LDA 模型
- Gensim - 创建 LSI 和 HDP 主题模型
- Gensim - 开发词嵌入
- Gensim - Doc2Vec 模型
- Gensim 有用资源
- Gensim - 快速指南
- Gensim - 有用资源
- Gensim - 讨论
Gensim - 入门指南
本章阐明了安装 Gensim 的先决条件,其核心依赖项以及有关其当前版本的信息。
先决条件
为了安装 Gensim,我们必须在计算机上安装 Python。您可以访问链接www.python.org/downloads/并选择适合您操作系统的最新版本,例如 Windows 和 Linux/Unix。您可以参考链接www.tutorialspoint.com/python3/index.htm了解 Python 的基本教程。Gensim 支持 Linux、Windows 和 Mac OS X。
代码依赖项
Gensim 应该在任何支持Python 2.7 或 3.5+和NumPy的平台上运行。它实际上依赖于以下软件 -
Python
Gensim 已在 Python 版本 2.7、3.5、3.6 和 3.7 上进行了测试。
Numpy
众所周知,NumPy 是一个用于 Python 科学计算的包。它也可以用作通用数据的有效多维容器。Gensim 依赖于 NumPy 包进行数值计算。有关 Python 的基本教程,您可以参考链接www.tutorialspoint.com/numpy/index.htm。
smart_open
smart_open 是一个 Python 2 和 Python 3 库,用于高效地流式传输非常大的文件。它支持从/到 S3、HDFS、WebHDFS、HTTP、HTTPS、SFTP 或本地文件系统等存储的流式传输。Gensim 依赖于smart_open Python 库来透明地打开远程存储上的文件以及压缩文件。
当前版本
Gensim 的当前版本为3.8.0,于 2019 年 7 月发布。
使用终端安装
安装 Gensim 的最简单方法之一是在终端中运行以下命令 -
pip install --upgrade gensim
使用Conda环境安装
下载 Gensim 的另一种方法是使用conda环境。在conda终端中运行以下命令 -
conda install –c conda-forge gensim
使用源代码包安装
假设您已下载并解压缩了源代码包,则需要运行以下命令 -
python setup.py test python setup.py install