SQL - 聚簇索引



数据库中的索引是一种数据结构,有助于提高从表和视图中检索特定数据的速度。

表中的数据以称为“堆”的无序数据结构的形式存储,其中行没有任何特定顺序地放置。因此,当从表中检索数据时,查询优化器必须扫描整个表以找到所需的行。此过程可能非常耗时,尤其是在处理大型表时。为了加快数据检索速度,SQL 提供了一个称为索引的数据对象,它以特定方式存储和组织表数据,从而允许更快地访问数据。

SQL 聚簇索引

SQL 中的聚簇索引是一种确定数据值在表中物理存储顺序的索引类型。

当在特定列上定义聚簇索引时,在创建新表期间,数据将按排序顺序插入该列。由于数据按特定顺序存储,因此这有助于更快地检索数据。

  • 建议表中只有一个聚簇索引。如果我们在同一表上创建多个聚簇索引,则表必须以多种顺序存储相同的数据,这是不可能的。
  • 当我们尝试在表上创建主键约束时,会在表上自动创建一个唯一的聚簇索引。但是,聚簇索引与主键不同。主键是对列或列集施加唯一性的约束,而聚簇索引决定表中数据的物理顺序。
MySQL 数据库没有为聚簇索引和非聚簇索引提供单独的规定。当在表上定义 PRIMARY KEY 时,会自动创建聚簇索引。当未定义 PRIMARY KEY 时,第一个 UNIQUE NOT NULL 键将被视为聚簇索引。

语法

以下是使用 SQL Server 创建聚簇索引的语法:

CREATE INDEX index_name ON table_name(column_name [asc|desc])

其中,

  • index_name:指定要赋予所创建索引的名称。
  • column_name:指定将按指定顺序编入索引的列。
  • asc|desc:指定数据应排序的顺序(asc - 升序,desc - 降序)。默认排序顺序为升序。

示例

在这个示例中,让我们在 SQL Server 中的表上创建一个聚簇索引。为此,我们需要首先使用以下查询创建一个名为CUSTOMERS的表:

CREATE TABLE CUSTOMERS( 
   ID INT NOT NULL, 
   NAME VARCHAR (20) NOT NULL, 
   AGE  INT NOT NULL, 
   ADDRESS CHAR (25), 
   SALARY DECIMAL (20, 2)
);

现在,使用以下查询将一些值插入 CUSTOMERS 表:

INSERT INTO CUSTOMERS VALUES
(7, 'Muffy', '24', 'Indore', 5500),
(1, 'Ramesh', '32', 'Ahmedabad', 2000),
(6, 'Komal', '22', 'Hyderabad', 9000),
(2, 'Khilan', '25', 'Delhi', 1500),
(4, 'Chaitali', '25', 'Mumbai', 6500),
(5, 'Hardik','27', 'Bhopal', 8500),
(3, 'Kaushik', '23', 'Kota', 2000);

该表已成功在 SQL Server 数据库中创建。

ID 姓名 年龄 地址 薪水
7 Muffy 24 印多尔 5500.00
1 Ramesh 32 艾哈迈达巴德 2000.00
6 Komal 22 海德拉巴 9000.00
2 Khilan 25 德里 1500.00
4 Chaitali 25 孟买 6500.00
5 Hardik 27 博帕尔 8500.00
3 Kaushik 23 科塔 2500.00

现在,让我们使用以下查询在名为ID的列上创建一个聚簇索引:

CREATE CLUSTERED INDEX CLU_ID ON CUSTOMERS(ID ASC);

输出

执行上述查询后,将显示如下输出:

Commands Completed Successfully.

验证

要验证是否在 ID 列上定义了聚簇索引,请使用以下查询检索记录以检查 CUSTOMERS 表的记录是否已排序:

SELECT * FROM CUSTOMERS;

该表中的记录根据名为 ID 的列中的值按升序排序。

ID 姓名 年龄 地址 薪水
1 Ramesh 32 艾哈迈达巴德 2000.00
2 Khilan 25 德里 1500.00
3 Kaushik 23 科塔 2500.00
4 Chaitali 25 孟买 6500.00
5 Hardik 27 博帕尔 8500.00
6 Komal 22 海德拉巴 9000.00
7 Muffy 24 印多尔 5500.00

在多列上创建聚簇索引

通过以下示例,让我们了解在表的多个列上创建聚簇索引的工作原理。

无需创建新表,请考虑先前创建的 CUSTOMERS 表,并使用以下查询在此表的多个列(例如 AGE 和 SALARY)上定义聚簇索引:

CREATE CLUSTERED INDEX MUL_CLUS_ID 
ON CUSTOMERS (AGE, SALARY ASC);

输出

当我们执行上述查询时,将获得如下输出:

Commands Completed Successfully.

验证

现在,让我们验证列AGESALARY中的值是否已排序:

SELECT * FROM CUSTOMERS;

正如我们在下表中观察到的那样,记录仅根据 AGE 列中的值排序,而不是根据 SALARY 列中的值排序。因此,建议表中只有一个聚簇索引。

ID 姓名 年龄 地址 薪水
6 Komal 22 海德拉巴 9000.00
3 Kaushik 23 科塔 2500.00
7 Muffy 24 印多尔 5500.00
2 Khilan 25 德里 1500.00
4 Chaitali 25 孟买 6500.00
5 Hardik 27 博帕尔 8500.00
1 Ramesh 32 艾哈迈达巴德 2000.00
广告