spaCy - Doc._ _init_ _方法



这是 Doc 类的最有用的方法之一。如名称所示,它用于构造一个Doc对象。

参数

下表说明了它的参数:

名称 类型 描述
词汇表 词汇表 参数表示词法类型的存储容器。
单词 iterable 它表示需要添加到容器的字符串列表。
空格 iterable 它是一个布尔值列表,表示每个单词是否有后续空格。如果要指定它,则需要使其长度与 words 相同。默认值将为真。

示例 1

用于使用 nlp 对象构造Doc._ _init_ _方法示例如下:

import spacy
nlp_model = spacy.load("en_core_web_sm")
doc = nlp_model("This is Tutorialspoint.com.")
doc

输出

运行代码后,您将看到以下输出:

This is Tutorialspoint.com.

示例 2

用于使用 DOC 类构造Doc._ _init_ _方法示例如下:

import spacy
from spacy.tokens import Doc
words = ["This is Tutorialspoint.com."]
doc = Doc(nlp_model.vocab, words=words)
doc

输出

运行代码后,您将看到以下输出:

This is Tutorialspoint.com.
spacy_containers.htm
广告
© . All rights reserved.