Apache Solr - 术语



在本章中,我们将尝试理解在使用 Solr 时经常使用的一些术语的真正含义。

通用术语

以下是所有类型的 Solr 设置中使用的通用术语列表:

  • 实例 − 就像Tomcat 实例Jetty 实例一样,此术语指的是在 JVM 内运行的应用程序服务器。Solr 的主目录提供对每个 Solr 实例的引用,其中可以在每个实例中配置一个或多个 Core 来运行。

  • Core − 在应用程序中运行多个索引时,您可以使用每个实例中的多个 Core,而不是每个实例只有一个 Core 的多个实例。

  • 主目录 − 术语 $SOLR_HOME 指的是包含有关 Core、其索引、配置和依赖项的所有信息的根目录。

  • 分片 (Shard) − 在分布式环境中,数据在多个 Solr 实例之间进行分区,其中每个数据块都可以称为分片 (Shard)。它包含整个索引的一个子集。

SolrCloud 术语

在前面章节中,我们讨论了如何在独立模式下安装 Apache Solr。请注意,我们也可以在分布式模式(云环境)下安装 Solr,其中 Solr 以主从模式安装。在分布式模式下,索引在主服务器上创建,并复制到一个或多个从服务器。

与 Solr Cloud 相关的关键术语如下:

  • 节点 (Node) − 在 Solr Cloud 中,Solr 的每个单个实例都被视为一个节点 (Node)

  • 集群 (Cluster) − 环境中的所有节点组合在一起构成一个集群 (Cluster)

  • 集合 (Collection) − 集群具有一个称为集合 (Collection) 的逻辑索引。

  • 分片 (Shard) − 分片是集合的一部分,它包含一个或多个索引副本。

  • 副本 (Replica) − 在 Solr Core 中,在节点中运行的分片副本称为副本 (Replica)

  • 领导者 (Leader) − 它也是分片的一个副本,它将 Solr Cloud 的请求分发到其余副本。

  • ZooKeeper − 这是一个 Apache 项目,Solr Cloud 使用它进行集中式配置和协调,以管理集群并选举领导者。

配置文件

Apache Solr 中的主要配置文件如下:

  • solr.xml − 它是 $SOLR_HOME 目录中的文件,包含与 Solr Cloud 相关的信息。为了加载 Core,Solr 会引用此文件,这有助于识别它们。

  • solrconfig.xml − 此文件包含与请求处理和响应格式相关的定义和特定于 Core 的配置,以及索引、配置、内存管理和提交。

  • schema.xml − 此文件包含整个模式以及字段和字段类型。

  • core.properties − 此文件包含特定于 Core 的配置。它用于Core 发现,因为它包含 Core 的名称和数据目录的路径。它可以在任何目录中使用,然后该目录将被视为Core 目录

广告