MySQL - 正则表达式



MySQL 支持各种类型的模式匹配操作,以从庞大的数据库表中检索过滤后的结果集。在前面的章节中,我们已经学习了用于模式匹配的 LIKE 运算符。在本章中,我们将看到另一个基于正则表达式的模式匹配操作。

MySQL 正则表达式

正则表达式被宽泛地定义为表示输入文本中模式的一系列字符。它用于使用某些模式查找或替换文本字符串;此模式可以是单个字符、多个字符或单词等。

MySQL 使用 Unicode 国际组件 (ICU) 实现正则表达式支持,该组件提供完整的 Unicode 支持并且是多字节安全的。

在 MySQL 中,它是一种强大的方式,可以在数据库中执行复杂的搜索操作以检索所需内容。与 LIKE 运算符不同,正则表达式在搜索模式(如 % 和 _)上不受限制,因为它们使用其他几个元字符来扩展模式匹配期间的灵活性与控制。这是使用 **REGEXP** 运算符执行的。

语法

以下是 MySQL 中 REGEXP 运算符的基本语法:

expression REGEXP pattern

与 REGEXP 一起使用的模式

以下是可与 **REGEXP** 运算符一起使用的模式表。

模式 模式匹配的内容
^ 字符串开头
$ 字符串结尾
. 任何单个字符
[...] 方括号之间列出的任何字符
[^...] 方括号之间未列出的任何字符
p1|p2|p3 交替;匹配模式 p1、p2 或 p3 中的任何一个
* 前一个元素的零个或多个实例
+ 前一个元素的一个或多个实例
{n} 前一个元素的 n 个实例
{m,n} 前一个元素的 m 到 n 个实例
[A-Z] 任何大写字母
[a-z] 任何小写字母
[0-9] 任何数字(从 0 到 9)
[[:<:]] 单词开头
[[:>:]] 单词结尾
[:class:] 字符类,即使用 [:alpha:] 匹配字母表中的字母

示例

以下示例演示了上表中提到的某些模式以及 REGEXP 运算符的使用。为此,我们首先创建一个数据库表来执行搜索。

假设我们使用以下查询创建一个名为 **CUSTOMERS** 的表:

CREATE TABLE CUSTOMERS (
   ID INT AUTO_INCREMENT,
   NAME VARCHAR(20) NOT NULL,
   AGE INT NOT NULL,
   ADDRESS CHAR (25),
   SALARY DECIMAL (18, 2),
   PRIMARY KEY (ID)
);

现在,使用下面给出的 INSERT 语句向其中插入一些值:

INSERT INTO CUSTOMERS (ID,NAME,AGE,ADDRESS,SALARY) VALUES 
(1, 'Ramesh', 32, 'Ahmedabad', 2000.00 ),
(2, 'Khilan', 25, 'Delhi', 1500.00 ),
(3, 'Kaushik', 23, 'Kota', 2000.00 ),
(4, 'Chaitali', 25, 'Mumbai', 6500.00 ),
(5, 'Hardik', 27, 'Bhopal', 8500.00 ),
(6, 'Komal', 22, 'Hyderabad', 4500.00 ),
(7, 'Muffy', 24, 'Indore', 10000.00 );

执行以下查询以显示上面创建的表中存在的所有记录:

SELECT * FROM CUSTOMERS;

以下是 CUSTOMERS 表中存在的记录:

ID NAME AGE ADDRESS SALARY
1 Ramesh 32 Ahmedabad 2000.00
2 Khilan 25 Delhi 1500.00
3 Kaushik 23 Kota 2000.00
4 Chaitali 25 Mumbai 6500.00
5 Hardik 27 Bhopal 8500.00
6 Komal 22 Hyderabad 4500.00
7 Muffy 24 Indore 10000.00

使用模式的 REGEXP:

现在,我们在 CUSTOMERS 表中查找名称以 **'k'** 开头的所有记录:

SELECT * FROM CUSTOMERS WHERE NAME REGEXP '^k';

执行上面的查询将产生以下输出:

ID NAME AGE ADDRESS SALARY
2 Khilan 25 Delhi 1500.00
3 Kaushik 23 Kota 2000.00
6 Komal 22 Hyderabad 4500.00

以下查询检索 CUSTOMERS 表中名称以 **'sh'** 结尾的所有记录:

SELECT * FROM CUSTOMERS WHERE NAME REGEXP 'sh$';

执行上面的查询将产生以下输出:

ID NAME AGE ADDRESS SALARY
1 Ramesh 32 Ahmedabad 2000.00

在这里,我们检索名称包含 **'sh'** 的所有记录:

SELECT * FROM CUSTOMERS WHERE NAME REGEXP 'sh';

如我们所见,只有两个名称包含“sh”。

ID NAME AGE ADDRESS SALARY
1 Ramesh 32 Ahmedabad 2000.00
3 Kaushik 23 Kota 2000.00

在以下查询中,我们查找 CUSTOMERS 表中所有以元音开头并以 **'ol'** 结尾的名称:

SELECT * FROM CUSTOMERS WHERE NAME REGEXP '^[aeiou].*ol$';

它返回了一个空集,因为 CUSTOMERS 表中没有以元音开头并以“ol”结尾的名称。

Empty set (0.00 sec)

以下查询查找 CUSTOMERS 表中名称以辅音开头的所有名称:

SELECT * FROM CUSTOMERS WHERE NAME REGEXP '^[^aeiou]';

执行上面的查询将产生以下输出:

ID NAME AGE ADDRESS SALARY
1 Ramesh 32 Ahmedabad 2000.00
2 Khilan 25 Delhi 1500.00
3 Kaushik 23 Kota 2000.00
4 Chaitali 25 Mumbai 6500.00
5 Hardik 27 Bhopal 8500.00
6 Komal 22 Hyderabad 4500.00
7 Muffy 24 Indore 10000.00

正则表达式函数和运算符

以下是正则表达式的函数和运算符表。

序号 函数或运算符
1

NOT REGEXP

REGEXP 的否定

2

REGEXP

检查字符串是否与正则表达式匹配

3

REGEXP_INSTR()

返回与正则表达式匹配的子字符串的起始索引

4

REGEXP_LIKE()

返回字符串是否与正则表达式匹配

5

REGEXP_REPLACE()

替换与正则表达式匹配的子字符串

6

REGEXP_SUBSTR()

返回与正则表达式匹配的子字符串

7

RLIKE

检查字符串是否与正则表达式匹配

广告