- Lucene 教程
- Lucene - 首页
- Lucene - 概述
- Lucene - 环境设置
- Lucene - 第一个应用程序
- Lucene - 索引类
- Lucene - 搜索类
- Lucene - 索引过程
- Lucene - 索引操作
- Lucene - 搜索操作
- Lucene - 查询编程
- Lucene - 分析
- Lucene - 排序
- Lucene 有用资源
- Lucene - 快速指南
- Lucene - 有用资源
- Lucene - 讨论
Lucene - 分析器
Analyzer 类负责分析文档并从要索引的文本中获取标记/单词。如果没有分析,IndexWriter 无法创建索引。
类声明
以下是org.apache.lucene.analysis.Analyzer类的声明:
public abstract class Analyzer extends Object implements Closeable
类构造函数
下表显示了一个类构造函数:
序号 | 构造函数和描述 |
---|---|
1 | protected Analyzer() |
类方法
下表显示了不同的类方法:
序号 | 方法和描述 |
---|---|
1 | void close() 释放分析器使用的持久性资源。 |
2 | int getOffsetGap(Fieldable field) 这类似于 getPositionIncrementGap(java.lang.String),只是针对 Token 偏移量。 |
3 | int getPositionIncrementGap(String fieldName) 如果已经向该字段添加了术语,则在索引Fieldable实例之前调用此方法。 |
4 | protected Object getPreviousTokenStream() 由实现可重用 TokenStream 的分析器使用,用于检索先前保存的 TokenStream 以供同一线程重复使用。 |
5 | TokenStream reusableTokenStream(String fieldName, Reader reader) 创建一个 TokenStream,允许它从同一线程上次调用此方法时重复使用。 |
6 | protected void setPreviousTokenStream(Object obj) 由实现 reusableTokenStream 的分析器使用,用于保存 TokenStream 以供同一线程稍后重复使用。 |
7 | abstract TokenStream tokenStream(String fieldName, Reader reader) 创建一个 TokenStream,它对提供的 Reader 中的所有文本进行标记化。 |
继承的方法
此类继承自以下类的方法:
- java.lang.Object
此分析器根据空格拆分文档中的文本。