Lucene - 索引类



索引过程是Lucene提供的核心功能之一。下图说明了索引过程和类的使用。IndexWriter 是索引过程中最重要和最核心的组件。

Indexing Process

我们将包含字段(Field)文档(Document)添加到IndexWriter中,IndexWriter使用分析器(Analyzer)分析文档(Document),然后根据需要创建/打开/编辑索引,并将它们存储/更新到目录(Directory)中。IndexWriter用于更新或创建索引,它不用于读取索引。

索引类

以下是索引过程中常用类列表。

序号 类及描述
1 IndexWriter

此类作为核心组件,在索引过程中创建/更新索引。

2 Directory

此类表示索引的存储位置。

3 Analyzer

此类负责分析文档并从要索引的文本中获取标记/单词。如果没有进行分析,IndexWriter无法创建索引。

4 Document

此类表示一个包含字段的虚拟文档,其中字段是一个对象,可以包含物理文档的内容、元数据等。分析器只能理解Document。

5 Field

这是索引过程的最低单位或起点。它表示键值对关系,其中键用于标识要索引的值。假设一个用于表示文档内容的字段,其键为“contents”,值可能包含文档部分或全部文本或数字内容。Lucene只能索引文本或数字内容。

广告