Lucene - 分析器



Analyzer 类负责分析文档并从将要建立索引的文本中获取标记/单词。如果没有分析过程,IndexWriter 无法创建索引。

类声明

以下是 org.apache.lucene.analysis.Analyzer 类的声明 −

public abstract class Analyzer
   extends Object
      implements Closeable

类构造函数

下表显示了一个类构造函数 −

序号 构造函数和说明
1

protected Analyzer()

类方法

下表显示了不同的类方法 −

序号 方法和说明
1

void close()

释放此 Analyzer 使用的持久资源。

2

int getOffsetGap(Fieldable field)

与 getPositionIncrementGap(java.lang.String) 相同,除了针对标记偏移量。

3

int getPositionIncrementGap(String fieldName)

如果已向该字段添加术语,则在建立 Fieldable 实例索引之前调用该方法。

4

protected Object getPreviousTokenStream()

由实现 reusableTokenStream 的 Analyzer 使用,以便检索先前保存的 TokenStream,以便由同一线程重新使用。

5

TokenStream reusableTokenStream(String fieldName, Reader reader)

在同一线程上上次调用此方法后被允许重新使用的 TokenStream。

6

protected void setPreviousTokenStream(Object obj)

由实现 reusableTokenStream 的 Analyzer 使用,以便保存 TokenStream,以便同一线程稍后重新使用。

7

abstract TokenStream tokenStream(String fieldName, Reader reader)

创建一个 TokenStream,对所提供的 Reader 中的所有文本进行标记化。

继承的方法

此类继承了以下类的以下方法 −

  • java.lang.Object
lucene_indexing_classes.htm
广告