- spaCy 教程
- spaCy - 首页
- spaCy - 简介
- spaCy - 入门
- spaCy - 模型和语言
- spaCy - 架构
- spaCy - 命令行助手
- spaCy - 顶级函数
- spaCy - 可视化函数
- spaCy - 实用函数
- spaCy - 兼容性函数
- spaCy - 容器
- Doc 类上下文管理器和属性
- spaCy - 容器 Token 类
- spaCy - Token 属性
- spaCy - 容器 Span 类
- spaCy - Span 类属性
- spaCy - 容器 Lexeme 类
- 训练神经网络模型
- 更新神经网络模型
- spaCy 有用资源
- spaCy - 快速指南
- spaCy - 有用资源
- spaCy - 讨论
spaCy - 调试数据命令
借助此命令,我们可以分析、调试和验证我们的训练和开发数据。我们还可以获得一些有用的统计信息,例如无效的实体标注、循环依赖关系和低数据标签等。
Debug-data 命令如下所示:
python -m spacy debug-data [lang] [train_path] [dev_path] [--base-model] [--pipeline] [--ignore-warnings] [--verbose] [--no-format]
参数
下表解释了它的参数:
参数 | 类型 | 描述 |
---|---|---|
lang | 位置参数 | 此参数表示模型语言。 |
train_path | 位置参数 | 这是 JSON 格式的训练数据的位置,可以是文件或文件目录。 |
dev_path | 位置参数 | 这是用于评估的 JSON 格式的开发数据的位置,可以是文件或文件目录。 |
--tag-map-path, -tm V2.2.4 | 选项 | 在版本 2.2.4 中引入,表示 JSON 格式的标签映射的位置。 |
--base-model, -b | 选项 | 此参数是要更新的基础模型的名称。它是可选的。它可以是任何可加载的 spaCy 模型。 |
--pipeline, -p | 选项 | 这是要训练的管道组件的逗号分隔名称。默认值为“tagger,parser,ner”。 |
--ignore-warnings, -IW | 标志 | 顾名思义,此参数将忽略警告,只显示统计信息和错误。 |
--verbose, -V | 标志 | 它将打印其他信息和说明。 |
–no-format, -NF | 标志 | 它将打印结果。如果您想写入文件,可以使用此参数。 |
广告