spaCy - Span._ _init_ _ 方法



这是Span类最常用的方法之一。顾名思义,它用于从切片doc[start : end]构造一个Span对象。

参数

下表解释了它的参数:

名称 类型 描述
Doc Doc 它表示父文档。
Start Int 它是跨度第一个token的索引。
End Int 它表示跨度后第一个token的索引。
Label int / unicode 它是标签,用于附加到跨度。例如,命名实体。从 2.1 版开始,标签也可以是 unicode 字符串。
kb_id int / unicode 它表示一个知识库 ID,用于附加到跨度。例如,命名实体。此 ID 可以是整数,也可以是 unicode 字符串。
vector numpy.ndarray[ndim=1, dtype='float32'] 它是跨度的含义表示。

示例 1

下面给出了 Span._ _init_ _ 方法的一个示例:

import spacy
nlp_model = spacy.load("en_core_web_sm")
doc = nlp_model("This is Tutorialspoint.com.")
span = doc[1:4]
span

输出

执行上述代码时,您应该会看到以下输出:

is Tutorialspoint.com.

示例 2

下面给出了 Span._ _init_ _ 方法的另一个示例:

[t.text for t in span]

输出

执行上述代码时,您应该会看到以下输出:

['is', 'Tutorialspoint.com', '.']
spacy_container_span_class.htm
广告

© . All rights reserved.