- Apache Solr 教程
- Apache Solr - 首页
- Apache Solr - 概述
- Apache Solr - 搜索引擎基础
- Apache Solr - Windows 环境
- Apache Solr - 在 Hadoop 上
- Apache Solr - 架构
- Apache Solr - 术语
- Apache Solr - 基本命令
- Apache Solr - Core
- Apache Solr - 索引数据
- Apache Solr - 添加文档 (XML)
- Apache Solr - 更新数据
- Apache Solr - 删除文档
- Apache Solr - 检索数据
- Apache Solr - 查询数据
- Apache Solr - 分面搜索
- Apache Solr 有用资源
- Apache Solr - 快速指南
- Apache Solr - 有用资源
- Apache Solr - 讨论
Apache Solr - 术语
在本章中,我们将尝试理解在使用 Solr 时经常使用的一些术语的真正含义。
通用术语
以下是所有类型的 Solr 设置中使用的通用术语列表:
实例 − 就像Tomcat 实例或Jetty 实例一样,此术语指的是在 JVM 内运行的应用程序服务器。Solr 的主目录提供对每个 Solr 实例的引用,其中可以在每个实例中配置一个或多个 Core 来运行。
Core − 在应用程序中运行多个索引时,您可以使用每个实例中的多个 Core,而不是每个实例只有一个 Core 的多个实例。
主目录 − 术语 $SOLR_HOME 指的是包含有关 Core、其索引、配置和依赖项的所有信息的根目录。
分片 (Shard) − 在分布式环境中,数据在多个 Solr 实例之间进行分区,其中每个数据块都可以称为分片 (Shard)。它包含整个索引的一个子集。
SolrCloud 术语
在前面章节中,我们讨论了如何在独立模式下安装 Apache Solr。请注意,我们也可以在分布式模式(云环境)下安装 Solr,其中 Solr 以主从模式安装。在分布式模式下,索引在主服务器上创建,并复制到一个或多个从服务器。
与 Solr Cloud 相关的关键术语如下:
节点 (Node) − 在 Solr Cloud 中,Solr 的每个单个实例都被视为一个节点 (Node)。
集群 (Cluster) − 环境中的所有节点组合在一起构成一个集群 (Cluster)。
集合 (Collection) − 集群具有一个称为集合 (Collection) 的逻辑索引。
分片 (Shard) − 分片是集合的一部分,它包含一个或多个索引副本。
副本 (Replica) − 在 Solr Core 中,在节点中运行的分片副本称为副本 (Replica)。
领导者 (Leader) − 它也是分片的一个副本,它将 Solr Cloud 的请求分发到其余副本。
ZooKeeper − 这是一个 Apache 项目,Solr Cloud 使用它进行集中式配置和协调,以管理集群并选举领导者。
配置文件
Apache Solr 中的主要配置文件如下:
solr.xml − 它是 $SOLR_HOME 目录中的文件,包含与 Solr Cloud 相关的信息。为了加载 Core,Solr 会引用此文件,这有助于识别它们。
solrconfig.xml − 此文件包含与请求处理和响应格式相关的定义和特定于 Core 的配置,以及索引、配置、内存管理和提交。
schema.xml − 此文件包含整个模式以及字段和字段类型。
core.properties − 此文件包含特定于 Core 的配置。它用于Core 发现,因为它包含 Core 的名称和数据目录的路径。它可以在任何目录中使用,然后该目录将被视为Core 目录。