SQL - 使用分组函数

使用分组函数报告聚合数据

SQL 有许多预定义的聚合函数，可用于编写查询以生成此类信息。GROUP BY 子句指定在聚合信息时如何对数据表中的行进行分组，而 HAVING 子句则过滤掉不属于指定组的行。

聚合函数执行各种操作，例如计算表中的所有行、对列的数据求平均值以及对数字数据求和。聚合还可以搜索表以查找列中的最高“MAX”或最低“MIN”值。与其他类型的查询一样，您可以使用 WHERE 子句限制或过滤掉这些函数作用的行。例如，如果经理需要知道组织中有多少员工，可以使用名为 COUNT(*) 的聚合函数来生成此信息。下面 SELECT 语句中显示的 COUNT(*) 函数计算表中的所有行。

SELECT COUNT(*)
FROM employees;

  COUNT(*)
----------
        24

COUNT(*) 函数的结果表是来自单行的单列，称为标量结果或值。请注意，结果表有一个列标题，它对应于 SELECT 子句中指定的聚合函数的名称。

一些常用的聚合函数如下所示：

SUM( [ALL | DISTINCT] expression )

AVG( [ALL | DISTINCT] expression )

COUNT( [ALL | DISTINCT] expression )

COUNT(*)

MAX(expression)

MIN(expression)

ALL 和 DISTINCT 关键字是可选的，它们的作用与您学习编写的 SELECT 子句相同。ALL 关键字是允许选项时的默认值。语法中列出的表达式可以是常量、函数或任何列名、常量和函数的组合，这些组合通过算术运算符连接。但是，聚合函数最常与列名一起使用。除 COUNT 函数外，所有聚合函数都不考虑 NULL 值。

使用聚合时，必须理解并遵循两条规则

聚合函数既可以在 SELECT 子句中使用，也可以在 HAVING 子句中使用（HAVING 子句将在本章后面介绍）。
聚合函数不能在 WHERE 子句中使用。违反此规则将产生 Oracle ORA-00934 group function is not allowed here 错误消息。

示例

下面的 SELECT 查询计算组织中员工的数量。

SELECT COUNT(*) Count
FROM employees;

COUNT
-----
   24

下面的 SELECT 查询返回组织中员工工资的平均值。

SELECT AVG(Salary) average_sal
FROM employees;

AVERAGE_SAL
-----------
      15694

下面的 SELECT 查询返回组织中员工工资的总和。

SELECT SUM(Salary) total_sal
FROM employees;

TOTAL_SAL
---------
    87472

下面的 SELECT 查询返回组织中员工最早和最新的入职日期。

SELECT MIN (hire_date) oldest, MAX (hire_date) latest
FROM employees;

OLDEST		LATEST
---------	-----------
16-JAN-83	01-JUL-2012

GROUP BY

聚合函数通常与 GROUP BY 子句一起使用。GROUP BY 子句使您可以使用聚合函数来回答更复杂的问题，例如：

每个部门员工的平均工资是多少？

每个部门有多少员工？

有多少员工正在从事某个特定项目？

GROUP BY 函数根据列建立数据组，并且仅聚合组内信息。分组标准由 GROUP BY 子句中指定的列定义。按照此层次结构，数据首先在组中组织，然后 WHERE 子句限制每个组中的行。

使用 GROUP BY 子句的指导原则

(1) GROUP BY 函数中使用的所有相关列或列都必须构成分组的基础，因此也必须包含在 GROUP BY 子句中。

SELECT	DEPARTMENT_ID, SUM(SALARY)
FROM employees;

DEPARTMENT_ID,
*
ERROR at line 2:
ORA-00937: not a single-group group function

(2) GROUP BY 子句不支持使用列别名，而应使用实际名称。

(3) GROUP BY 子句只能与 SUM、AVG、COUNT、MAX 和 MIN 等聚合函数一起使用。如果与单行函数一起使用，Oracle 将抛出“ORA-00979: not a GROUP BY expression”异常。

(4) 聚合函数不能在 GROUP BY 子句中使用。Oracle 将返回错误消息“ORA-00934: group function not allowed here”。

下面的查询列出了每个部门工作的员工数量。

SELECT  DEPARTMENT_ID,  COUNT (*)
FROM employees
GROUP BY DEPARTMENT_ID;

类似地，下面的查询用于查找每个部门中各个职位 ID 的工资总和。请注意，组是根据部门和职位 ID 建立的。因此，它们出现在 GROUP BY 子句中。

SELECT DEPARTMENT_ID, JOB_ID, SUM (SAL)
FROM employees
GROUP BY DEPARTMENT_ID, JOB_ID;

下面的查询也产生相同的结果。请注意，分组基于部门 ID 和职位 ID 列，但不用于显示目的。

SELECT SUM (SALARY)
FROM employees
GROUP BY DEPARTMENT_ID, JOB_ID;

在聚合函数中使用 DISTINCT 和 ALL 关键字

通过在输入参数中指定 DISTINCT 关键字，GROUP BY 函数仅考虑列的唯一值进行聚合。通过在输入参数中指定 ALL 关键字，GROUP BY 函数考虑列的所有值进行聚合，包括 NULL 值和重复值。ALL 是默认规范。

HAVING 子句

HAVING 子句用于聚合函数，其方式与 WHERE 子句用于列名和表达式的方式相同。本质上，HAVING 和 WHERE 子句执行相同的操作，即根据条件过滤掉结果表中包含的行。虽然看起来 HAVING 子句过滤掉组，但实际上并非如此。相反，HAVING 子句过滤行。

当组的所有行都被消除时，组也会被消除。总而言之，WHERE 和 HAVING 子句之间最重要的区别是：

WHERE 子句用于在分组操作之前过滤行（即在计算聚合函数之前）。

HAVING 子句在分组操作之后过滤行（即在计算聚合函数之后）。

SELECT JOB_ID,	SUM (SALARY)
FROM employees
GROUP BY JOB_ID
HAVING SUM (SALARY) > 10000;

HAVING 子句是一个条件选项，它与 GROUP BY 子句选项直接相关，因为 HAVING 子句根据 GROUP BY 子句的结果从结果表中消除行。

SELECT department_id, AVG(Salary)
FROM employees
HAVING AVG(Salary) > 33000;
ERROR at line 1:  ORA-00937: not a single-group group function

打印页面