spaCy - 调试数据命令



借助此命令,我们可以分析、调试和验证我们的训练和开发数据。我们还可以获得一些有用的统计信息,例如无效的实体标注、循环依赖关系和低数据标签等。

Debug-data 命令如下所示:

python -m spacy debug-data [lang] [train_path] [dev_path] [--base-model] [--pipeline] [--ignore-warnings] [--verbose] [--no-format]

参数

下表解释了它的参数:

参数 类型 描述
lang 位置参数 此参数表示模型语言。
train_path 位置参数 这是 JSON 格式的训练数据的位置,可以是文件或文件目录。
dev_path 位置参数 这是用于评估的 JSON 格式的开发数据的位置,可以是文件或文件目录。
--tag-map-path, -tm V2.2.4 选项 在版本 2.2.4 中引入,表示 JSON 格式的标签映射的位置。
--base-model, -b 选项 此参数是要更新的基础模型的名称。它是可选的。它可以是任何可加载的 spaCy 模型。
--pipeline, -p 选项 这是要训练的管道组件的逗号分隔名称。默认值为“tagger,parser,ner”。
--ignore-warnings, -IW 标志 顾名思义,此参数将忽略警告,只显示统计信息和错误。
--verbose, -V 标志 它将打印其他信息和说明。
–no-format, -NF 标志 它将打印结果。如果您想写入文件,可以使用此参数。
广告