MySQL - 并集 (UNION) 与连接 (JOIN)



MySQL 提供各种关系运算符来处理关系数据库中分布在多个表中的数据。其中,UNION 和 JOIN 查询主要用于组合来自多个表的数据。

尽管它们都用于相同的目的,即组合表,但这些运算符的工作方式之间存在许多差异。主要区别在于,UNION 运算符组合来自多个相似表的无论数据相关性如何的数据,而 JOIN 运算符仅用于组合来自多个表的相关数据。

UNION 的工作原理

UNION 是 MySQL 中的一种运算符/子句,其工作方式类似于关系代数中的并集运算符。它只不过是组合来自多个联合兼容的表的信息。

如果满足以下条件,则称这些表为联合兼容的

  • 要组合的表必须具有相同数量的列,并且数据类型相同。
  • 行数不必相同。

一旦满足这些条件,UNION 运算符就会返回来自多个表的所有行(在消除重复行之后)作为结果表。

注意:第一个表的列名将成为结果表的列名,第二个表的内容将合并到具有相同数据类型的结果列中。

语法

以下是 MySQL 中 UNION 运算符的语法:

SELECT * FROM table1
UNION
SELECT * FROM table2;

示例

让我们首先创建两个表“COURSES_PICKED”和“EXTRA_COURSES_PICKED”,它们具有相同数量的列,并且数据类型相同。

使用以下查询创建 COURSES_PICKED 表:

CREATE TABLE COURSES_PICKED(
   STUDENT_ID INT NOT NULL, 
   STUDENT_NAME VARCHAR(30) NOT NULL, 
   COURSE_NAME VARCHAR(30) NOT NULL
);

使用以下查询将值插入 COURSES_PICKED 表:

INSERT INTO COURSES_PICKED VALUES
(1, 'JOHN', 'ENGLISH'),
(2, 'ROBERT', 'COMPUTER SCIENCE'),
(3, 'SASHA', 'COMMUNICATIONS'),
(4, 'JULIAN', 'MATHEMATICS');

使用以下查询创建 EXTRA_COURSES_PICKED 表:

CREATE TABLE EXTRA_COURSES_PICKED(
   STUDENT_ID INT NOT NULL, 
   STUDENT_NAME VARCHAR(30) NOT NULL, 
   EXTRA_COURSE_NAME VARCHAR(30) NOT NULL
);

以下是将值插入 EXTRA_COURSES_PICKED 表的查询:

INSERT INTO EXTRA_COURSES_PICKED VALUES
(1, 'JOHN', 'PHYSICAL EDUCATION'),
(2, 'ROBERT', 'GYM'),
(3, 'SASHA', 'FILM'),
(4, 'JULIAN', 'PHOTOGRAPHY');

现在,让我们使用以下 UNION 查询组合这两个表:

SELECT * FROM COURSES_PICKED
UNION
SELECT * FROM EXTRA_COURSES_PICKED;

输出

执行 UNION 操作后获得的结果表为:

STUDENT_ID STUDENT_NAME COURSE_NAME
1 John 英语
1 John 体育
2 Robert 计算机科学
2 Robert 健身房
3 Sasha 传播学
3 Sasha 电影
4 Julian 数学
4 Julian 摄影

JOIN 的工作原理

连接操作用于根据公共字段将来自多个相关表的信息组合到一个表中。

在此操作中,第一个表的每一行都将与第二个表的每一行组合。获得的结果表将包含两个表中存在的行。此操作可以与各种子句一起使用,例如 ON、WHERE、ORDER BY、GROUP BY 等。

连接有两种类型

  • 内连接
  • 外连接

基本类型的连接是内连接,它只检索公共列的匹配值。它是默认连接。其他连接,如交叉连接、自然连接、条件连接等,都是内连接的类型。

外连接在结果表中包含来自第一个表的匹配行和不匹配行。它分为左连接、右连接和全连接等子类型。

尽管连接操作可以合并多个表,但连接两个表的最简单方法是不使用除 ON 子句之外的任何其他子句。

语法

以下是连接操作的基本语法:

SELECT column_name(s)
FROM table1
JOIN table2
ON table1.common_field = table2.common_field;

示例

在以下示例中,我们将尝试使用以下查询连接上面创建的相同表,即 COURSES_PICKED 和 EXTRA_COURSES_PICKED:

mysql> SELECT c.STUDENT_ID, c.STUDENT_NAME, COURSE_NAME, 
COURSES_PICKED FROM COURSES_PICKED c JOIN EXTRA_COURSES_PICKED e
ON c.STUDENT_ID = e.STUDENT_ID;

输出

结果表将显示如下:

STUDENT_ID STUDENT_NAME COURSE_NAME COURSE_PICKED
1 John 英语 体育
2 Robert 计算机科学 健身房
3 Sasha 传播学 电影
4 Julian 数学 摄影

UNION 与 JOIN

正如我们在上面给出的示例中看到的,UNION 运算符只能对联合兼容的表执行,而 JOIN 运算符连接的表不必兼容,但应该相关。

让我们总结一下这些查询之间的所有区别:

UNION JOIN
UNION 操作仅对联合兼容的表执行,即表必须包含相同数量的列,并且数据类型相同。 JOIN 操作可以对至少具有一个公共字段的表执行。表不必是联合兼容的。
组合的数据将作为结果表的新行添加。 组合的数据将作为新列添加到结果表中。
这作为合取运算工作。 这作为交集运算工作。
UNION 从结果表中删除所有重复值。 JOIN 保留来自两个表的所有值,即使它们是冗余的。
UNION 不需要任何额外的子句来组合两个表。 JOIN 需要额外的 ON 子句来根据公共字段组合两个表。
它主要用于以下场景:将组织中的旧员工列表与新员工列表合并。 这用于需要合并相关表的场景。例如,组合包含客户列表及其所下订单的表。
广告