spaCy - 模型初始化



与1.x版本中的spacy model命令类似,Init model命令用于根据原始数据(例如Brown聚类和词向量)创建新的模型目录。

Init model命令如下:

python -m spacy init-model [lang] [output_dir] [--jsonl-loc] [--vectors-loc][--prune-vectors]

参数

下表解释了它的参数:

参数 类型 描述
lang 位置参数 它表示模型语言的ISO代码。例如,en
output_dir 位置参数 此参数表示模型输出目录。如果它不存在,则会创建它。
--jsonl-loc, -j 可选参数 它表示包含词汇属性的JSONL格式词汇文件的可选位置。
--vectors-loc, -v 可选参数 它表示向量的可选位置。它应该是一个文件,其中第一行包含向量的维度,后跟一个空格分隔的Word2Vec表。该文件可以以.txt格式提供,也可以以.zip.tar.gz格式的压缩文本文件提供。
--truncate-vectors, -t 可选参数 在2.3版本中引入,表示读取向量文件时要截断的向量数量。默认值为0,表示不截断。
--prune-vectors, -V 可选参数 此参数表示要将词汇表修剪到的向量数量。默认值为-1,表示不修剪。
--vectors-name, -vn 可选参数 这是要分配给meta.json中词向量的名称。例如,en_core_web_md.vectors
--omit-extra-lookups, -OEL 标志 在2.3版本中引入,它将从模型中的spacy-lookups-data中省略任何额外的查找表(聚类/概率/情感)。
spacy_command_line_helpers.htm
广告
© . All rights reserved.