- spaCy 教程
- spaCy - 主页
- spaCy - 简介
- spaCy - 入门
- spaCy - 模型和语言
- spaCy - 架构
- spaCy - 命令行助手
- spaCy - 顶级函数
- spaCy - 可视化函数
- spaCy - 实用函数
- spaCy - 兼容性函数
- spaCy - 容器
- Doc 类 ContextManager 和属性
- spaCy - 容器标记类
- spaCy - 标记属性
- spaCy - 容器跨度类
- spaCy - 跨度类属性
- spaCy - 容器词素类
- 神经网络模型训练
- 更新神经网络模型
- spaCy 有用资源
- spaCy - 快速指南
- spaCy - 有用资源
- spaCy - 讨论
spaCy - Doc._ _init_ _方法
这是 Doc 类的最有用的方法之一。如名称所示,它用于构造一个Doc对象。
参数
下表说明了它的参数:
| 名称 | 类型 | 描述 |
|---|---|---|
| 词汇表 | 词汇表 | 参数表示词法类型的存储容器。 |
| 单词 | iterable | 它表示需要添加到容器的字符串列表。 |
| 空格 | iterable | 它是一个布尔值列表,表示每个单词是否有后续空格。如果要指定它,则需要使其长度与 words 相同。默认值将为真。 |
示例 1
用于使用 nlp 对象构造的Doc._ _init_ _方法示例如下:
import spacy
nlp_model = spacy.load("en_core_web_sm")
doc = nlp_model("This is Tutorialspoint.com.")
doc
输出
运行代码后,您将看到以下输出:
This is Tutorialspoint.com.
示例 2
用于使用 DOC 类构造的Doc._ _init_ _方法示例如下:
import spacy from spacy.tokens import Doc words = ["This is Tutorialspoint.com."] doc = Doc(nlp_model.vocab, words=words) doc
输出
运行代码后,您将看到以下输出:
This is Tutorialspoint.com.
spacy_containers.htm
广告