spaCy - Span._ _init_ _ 方法

这是Span类最常用的方法之一。顾名思义，它用于从切片doc[start : end]构造一个Span对象。

参数

下表解释了它的参数：

名称	类型	描述
Doc	Doc	它表示父文档。
Start	Int	它是跨度第一个token的索引。
End	Int	它表示跨度后第一个token的索引。
Label	int / unicode	它是标签，用于附加到跨度。例如，命名实体。从 2.1 版开始，标签也可以是 unicode 字符串。
kb_id	int / unicode	它表示一个知识库 ID，用于附加到跨度。例如，命名实体。此 ID 可以是整数，也可以是 unicode 字符串。
vector	numpy.ndarray[ndim=1, dtype='float32']	它是跨度的含义表示。

下面给出了 Span._ _init_ _ 方法的一个示例：

import spacy
nlp_model = spacy.load("en_core_web_sm")
doc = nlp_model("This is Tutorialspoint.com.")
span = doc[1:4]
span

执行上述代码时，您应该会看到以下输出：

is Tutorialspoint.com.

下面给出了 Span._ _init_ _ 方法的另一个示例：

[t.text for t in span]

执行上述代码时，您应该会看到以下输出：

['is', 'Tutorialspoint.com', '.']

spacy_container_span_class.htm

打印页面