- SQL 教程
- SQL - 首页
- SQL - 概述
- SQL - RDBMS 概念
- SQL - 数据库
- SQL - 语法
- SQL - 数据类型
- SQL - 运算符
- SQL - 表达式
- SQL 数据库
- SQL - 创建数据库
- SQL - 删除数据库
- SQL - 选择数据库
- SQL - 重命名数据库
- SQL - 显示数据库
- SQL - 备份数据库
- SQL 表
- SQL - 创建表
- SQL - 显示表
- SQL - 重命名表
- SQL - 截断表
- SQL - 克隆表
- SQL - 临时表
- SQL - 修改表
- SQL - 删除表
- SQL - 删除表
- SQL - 约束
- SQL 查询
- SQL - 插入查询
- SQL - 选择查询
- SQL - SELECT INTO
- SQL - INSERT INTO SELECT
- SQL - 更新查询
- SQL - 删除查询
- SQL - 排序结果
- SQL 视图
- SQL - 创建视图
- SQL - 更新视图
- SQL - 删除视图
- SQL - 重命名视图
- SQL 运算符和子句
- SQL - WHERE 子句
- SQL - TOP 子句
- SQL - DISTINCT 子句
- SQL - ORDER BY 子句
- SQL - GROUP BY 子句
- SQL - HAVING 子句
- SQL - AND & OR
- SQL - BOOLEAN (BIT) 运算符
- SQL - LIKE 运算符
- SQL - IN 运算符
- SQL - ANY, ALL 运算符
- SQL - EXISTS 运算符
- SQL - CASE
- SQL - NOT 运算符
- SQL - 不等于
- SQL - IS NULL
- SQL - IS NOT NULL
- SQL - NOT NULL
- SQL - BETWEEN 运算符
- SQL - UNION 运算符
- SQL - UNION vs UNION ALL
- SQL - INTERSECT 运算符
- SQL - EXCEPT 运算符
- SQL - 别名
- SQL 连接
- SQL - 使用连接
- SQL - 内连接
- SQL - 左连接
- SQL - 右连接
- SQL - 交叉连接
- SQL - 全连接
- SQL - 自连接
- SQL - 删除连接
- SQL - 更新连接
- SQL - 左连接 vs 右连接
- SQL - UNION vs JOIN
- SQL 密钥
- SQL - 唯一键
- SQL - 主键
- SQL - 外键
- SQL - 组合键
- SQL - 备选键
- SQL 索引
- SQL - 索引
- SQL - 创建索引
- SQL - 删除索引
- SQL - 显示索引
- SQL - 唯一索引
- SQL - 聚集索引
- SQL - 非聚集索引
- 高级 SQL
- SQL - 通配符
- SQL - 注释
- SQL - 注入
- SQL - 托管
- SQL - MIN & MAX
- SQL - NULL 函数
- SQL - CHECK 约束
- SQL - DEFAULT 约束
- SQL - 存储过程
- SQL - NULL 值
- SQL - 事务
- SQL - 子查询
- SQL - 处理重复项
- SQL - 使用序列
- SQL - 自动递增
- SQL - 日期和时间
- SQL - 游标
- SQL - 公共表表达式
- SQL - GROUP BY vs ORDER BY
- SQL - IN vs EXISTS
- SQL - 数据库调优
- SQL 函数参考
- SQL - 日期函数
- SQL - 字符串函数
- SQL - 聚合函数
- SQL - 数值函数
- SQL - 文本和图像函数
- SQL - 统计函数
- SQL - 逻辑函数
- SQL - 游标函数
- SQL - JSON 函数
- SQL - 转换函数
- SQL - 数据类型函数
- SQL 有用资源
- SQL - 问答
- SQL - 快速指南
- SQL - 有用函数
- SQL - 有用资源
- SQL - 讨论
SQL - APPROX_COUNT_DISTINCT() 函数
SQL APPROX_COUNT_DISTINCT() 函数返回具有不同表达式值的近似行数。此函数提供 COUNT (DISTINCT 表达式) 函数的替代方案。此函数比 COUNT-DISTINCT 执行操作使用更少的内存。它是 SQL Server 2019 中引入的新函数之一。
APPROX_COUNT_DISTINCT() 函数主要用于大数据场景。此函数返回组中唯一非空值的个数。它通常用于具有超过一百万行的庞大数据集以及具有许多不同值的列的聚合。它专为响应速度比绝对清晰度更重要的场景而设计。此函数会忽略包含空值的那些行。
语法
以下是 **SQL APPROX_COUNT_DISTINCT()** 函数的语法:
APPROX_COUNT_DISTINCT( expression )
参数
**表达式** - 任何类型的表达式。此函数不接受图像、sql_variant 或文本。
示例
在下面的示例中,我们使用 APPROC_COUNT_DISTINCT() 函数从 customers 表中获取列“AGE”中值的近似个数。假设我们使用以下查询创建了一个名为 customers 的表:
CREATE TABLE customers(ID INT NOT NULL, NAME VARCHAR(30) NOT NULL, AGE INT NOT NULL, ADDRESS CHAR(30), SALARY DECIMAL(18, 2));
该表存储 ID、NAME、AGE、ADDRESS 和 SALARY。现在我们使用 INSERT 语句在 customers 表中插入 7 条记录。
INSERT INTO customers VALUES(1, 'Ramesh', 32, 'Ahmedabad', 2000.00); INSERT INTO customers VALUES(2, 'Khilan', 25, 'Delhi', 1500.00); INSERT INTO customers VALUES(3, 'kaushik', 23, 'Kota', 2000.00); INSERT INTO customers VALUES(4, 'Chaitali', 25, 'Mumbai', 6500.00); INSERT INTO customers VALUES(5, 'Hardik', 27, 'Bhopal', 8500.00); INSERT INTO customers VALUES(6, 'Komal', 22, 'MP', 4500.00); INSERT INTO customers VALUES(7, 'Aman', 23, 'Ranchi', null); INSERT INTO customers VALUES(8,'Aman', 23, 'Delhi', 3000.00); INSERT INTO customers VALUES(9, 'Khilan', 25, 'Delhi', 3000.00);customers 表的创建如下所示:
+----+----------+-----+-----------+---------+ | ID | NAME | AGE | ADDRESS | SALARY | +----+----------+-----+-----------+---------+ | 1 | Ramesh | 32 | Ahmedabad | 2000.00 | | 2 | Khilan | 25 | Delhi | 1500.00 | | 3 | kaushik | 23 | Kota | 2000.00 | | 4 | Chaitali | 25 | Mumbai | 6500.00 | | 5 | Hardik | 27 | Bhopal | 8500.00 | | 6 | Komal | 22 | MP | 4500.00 | | 7 | Aman | 23 | Ranchi | 5000.00 | | 8 | Aman | 22 | Delhi | 3000.00 | | 9 | Khilan | 25 | Delhi | 3000.00 | +----+----------+-----+-----------+---------+
以下 SQL 查询显示客户 DISTINCT AGE 的近似计数:
SELECT APPROX_COUNT_DISTINCT(AGE) AS Approx_Distinct_AGE FROM customers;
输出
以下是上述 SQL 查询的输出:
+--------------------+ |Approx_Distinct_AGE | +--------------------+ | 5 | +--------------------+
示例
在下面的示例中,在 customers 表上使用带有 GROUP BY 子句的 APPROX_COUNT_DISTINCT() 函数。它获取所有名称并计算不同的年龄值:
SELECT NAME, APPROX_COUNT_DISTINCT(AGE) AS Approx_Distinct_AGE FROM customers GROUP BY NAME;
输出
以下是上述 SQL 查询的输出。在 customers 表中,有多个名称具有相同的年龄,但 APPROX_COUNT_DISTINCT() 函数仅计算不同的值:
+---------+---------------------+ | NAME | Approx_Distinct_AGE | +---------+---------------------+ | Ramesh | 1 | +---------+---------------------+ | Hardik | 1 | +---------+---------------------+ | Aman | 1 | +---------+---------------------+ | kaushik | 1 | +---------+---------------------+ | Chaitali| 1 | +---------+---------------------+ | Khilan | 1 | +---------+---------------------+ | Komal | 1 | +---------+---------------------+
示例
在下面的示例中,我们获取 ID 和 salary,并使用 APPROX_COUNT_DISTINCT() 函数来计算不同的 salary。显示 ID 和 salary 以及“group by”和“order by”子句。
以下 SQL 查询将从上述客户表中获取 ID、salary 和 salary 的计数:
SELECT ID, SALARY, APPROX_COUNT_DISTINCT(SALARY) AS Approx_Distinct_SALARY FROM customers GROUP BY ID, SALARY ORDER BY ID;
输出
以下是上述 SQL 查询的输出:
+----+----------+------------------------+ | ID | SALARY | Approx_Distinct_SALARY | +----+----------+------------------------+ | 1 | 2000.00 | 1 | +----|----------+------------------------+ | 2 | 1500.00 | 1 | +----|----------+------------------------+ | 3 | 2000.00 | 1 | +----|----------+------------------------+ | 4 | 6500.00 | 1 | +----|----------+------------------------+ | 5 | 8500.00 | 1 | +----|----------+------------------------+ | 6 | 4500.00 | 1 | +----|----------+------------------------+ | 7 | 5000.00 | 1 | +----|----------+------------------------+ | 8 | 3000.00 | 1 | +----|----------+------------------------+ | 9 | 3000.00 | 1 | +----|----------+------------------------+