- spaCy 教程
- spaCy - 首页
- spaCy - 简介
- spaCy - 快速入门
- spaCy - 模型和语言
- spaCy - 架构
- spaCy - 命令行助手
- spaCy - 顶级函数
- spaCy - 可视化函数
- spaCy - 实用函数
- spaCy - 兼容性函数
- spaCy - 容器
- Doc 类上下文管理器和属性
- spaCy - 容器 Token 类
- spaCy - Token 属性
- spaCy - 容器 Span 类
- spaCy - Span 类属性
- spaCy - 容器 Lexeme 类
- 训练神经网络模型
- 更新神经网络模型
- spaCy 有用资源
- spaCy - 快速指南
- spaCy - 有用资源
- spaCy - 讨论
spaCy - 模型初始化
与1.x版本中的spacy model命令类似,Init model命令用于根据原始数据(例如Brown聚类和词向量)创建新的模型目录。
Init model命令如下:
python -m spacy init-model [lang] [output_dir] [--jsonl-loc] [--vectors-loc][--prune-vectors]
参数
下表解释了它的参数:
| 参数 | 类型 | 描述 |
|---|---|---|
| lang | 位置参数 | 它表示模型语言的ISO代码。例如,en。 |
| output_dir | 位置参数 | 此参数表示模型输出目录。如果它不存在,则会创建它。 |
| --jsonl-loc, -j | 可选参数 | 它表示包含词汇属性的JSONL格式词汇文件的可选位置。 |
| --vectors-loc, -v | 可选参数 | 它表示向量的可选位置。它应该是一个文件,其中第一行包含向量的维度,后跟一个空格分隔的Word2Vec表。该文件可以以.txt格式提供,也可以以.zip或.tar.gz格式的压缩文本文件提供。 |
| --truncate-vectors, -t | 可选参数 | 在2.3版本中引入,表示读取向量文件时要截断的向量数量。默认值为0,表示不截断。 |
| --prune-vectors, -V | 可选参数 | 此参数表示要将词汇表修剪到的向量数量。默认值为-1,表示不修剪。 |
| --vectors-name, -vn | 可选参数 | 这是要分配给meta.json中词向量的名称。例如,en_core_web_md.vectors。 |
| --omit-extra-lookups, -OEL | 标志 | 在2.3版本中引入,它将从模型中的spacy-lookups-data中省略任何额外的查找表(聚类/概率/情感)。 |
spacy_command_line_helpers.htm
广告