Lucene - 分析器



Analyzer 类负责分析文档并从要索引的文本中获取标记/单词。如果没有分析,IndexWriter 无法创建索引。

类声明

以下是org.apache.lucene.analysis.Analyzer类的声明:

public abstract class Analyzer
   extends Object
      implements Closeable

类构造函数

下表显示了一个类构造函数:

序号 构造函数和描述
1

protected Analyzer()

类方法

下表显示了不同的类方法:

序号 方法和描述
1

void close()

释放分析器使用的持久性资源。

2

int getOffsetGap(Fieldable field)

这类似于 getPositionIncrementGap(java.lang.String),只是针对 Token 偏移量。

3

int getPositionIncrementGap(String fieldName)

如果已经向该字段添加了术语,则在索引Fieldable实例之前调用此方法。

4

protected Object getPreviousTokenStream()

由实现可重用 TokenStream 的分析器使用,用于检索先前保存的 TokenStream 以供同一线程重复使用。

5

TokenStream reusableTokenStream(String fieldName, Reader reader)

创建一个 TokenStream,允许它从同一线程上次调用此方法时重复使用。

6

protected void setPreviousTokenStream(Object obj)

由实现 reusableTokenStream 的分析器使用,用于保存 TokenStream 以供同一线程稍后重复使用。

7

abstract TokenStream tokenStream(String fieldName, Reader reader)

创建一个 TokenStream,它对提供的 Reader 中的所有文本进行标记化。

继承的方法

此类继承自以下类的方法:

  • java.lang.Object

此分析器根据空格拆分文档中的文本。

lucene_analysis.htm
广告