什么是并行数据库?并解释其工作原理。
并行数据库是指使用多个处理器并行工作于数据库以提供服务的数据库。
并行数据库系统旨在通过并行化各种操作(如加载数据、构建索引和评估查询)来提高性能。并行系统通过并行使用多个 CPU 和磁盘来提高处理和 I/O 速度。
并行数据库的工作原理
让我们逐步讨论并行数据库的工作原理:
步骤 1 - 并行处理将一个大型任务分解成许多较小的任务,并在多个 CPU 上并发执行这些较小的任务,从而更快地完成任务。
步骤 2 - 并行数据库系统的驱动力是对能够查询数TB级超大型数据库或每秒处理大量事务的应用程序的需求。
步骤 3 - 在并行处理中,许多操作是同时执行的,而串行处理中计算步骤是顺序执行的。
下图解释了并行数据库的工作原理:

性能指标
数据库系统的性能主要有两个资源,解释如下:
吞吐量 - 在给定时间间隔内可以完成的任务数量。通过并行处理许多事务,处理大量小型事务的系统可以提高吞吐量。
响应时间 - 从提交任务到完成单个任务所需的时间。处理大型事务的系统可以通过并行执行每个事务的子任务来提高响应时间和吞吐量。
并行数据库的优势
并行数据库的优势解释如下:
速度
速度是并行数据库的主要优势。服务器将用户的数据库请求分解成多个部分,并将每个部分发送到单独的计算机。
我们最终处理这些部分并将输出组合起来,然后返回给用户。它加快了大多数数据请求的速度,从而可以更容易地访问大型数据库。
容量
随着越来越多的用户请求访问数据库,网络管理员会向并行服务器添加更多机器,从而增加其整体容量。
例如,并行数据库使大型在线商店能够同时让数千用户访问信息。使用单个服务器,这种级别的性能是不可行的。
可靠性
即使集群中的任何计算机发生故障,正确配置的并行数据库也将继续工作。数据库服务器会检测到来自单个计算机的无响应,并将功能重定向到其他计算机。
许多公司,例如在线零售商,都希望他们的数据库能够尽可能快地访问。这就是并行数据库的优势所在。
此方法还有助于逐台计算机进行计划的维护。他们发送服务器命令卸载受影响的设备,然后执行所需的维护和更新。
查询优势
并行查询处理可以使以下类型的查询受益:
扫描大量页面但仅输出几行的 SELECT 语句。
包含 UNION、ORDER BY 或 DISTINCT 的 SELECT 语句,因为这些查询可以并行填充工作表,并且可以使用并行排序。
使用合并连接的 SELECT 语句可以使用并行处理来扫描表,以及进行排序和合并。
优化器选择重新格式化策略的 SELECT 语句,因为这些语句可以并行填充工作表,并且可以使用并行排序。
CREATE INDEX 语句,以及创建索引、唯一键和主键的 ALTER TABLE - ADD CONSTRAINT 子句。
数据结构
网络
RDBMS
操作系统
Java
iOS
HTML
CSS
Android
Python
C语言编程
C++
C#
MongoDB
MySQL
Javascript
PHP