DISTINCT 与 GROUP BY 在结果集与性能上的细微区别

舞夢輝影

发布时间：2026-01-28 18:16:43

904人浏览过

来源于php中文网

原创

不等价；DISTINCT对整行去重，GROUP BY按列分组并要求聚合或严格模式，语义、错误行为、性能及兼容性均不同。

distinct 与 group by 在结果集与性能上的细微区别

DISTINCT 和 GROUP BY 在结果集上是否等价？

多数情况下，DISTINCT 和 GROUP BY 对单列去重返回的结果看起来一样，但语义和行为并不等价。关键区别在于：DISTINCT 是对整个行做唯一性判断，而 GROUP BY 是按指定列分组后，每组只取一行（但若未配合聚合函数，MySQL 5.7+ 默认拒绝执行，PostgreSQL 和 SQL Server 则直接报错）。

常见错误现象：

在 MySQL 5.7+ 中写 SELECT a, b FROM t GROUP BY a 会报错 ERROR 1055，除非 sql_mode 关闭了 ONLY_FULL_GROUP_BY
用 SELECT DISTINCT a, b FROM t 能跑通，但实际是把 (a,b) 当作联合唯一键；而 GROUP BY a 意图是“每个 a 取一条 b”，但 b 的值不明确——数据库可能随便挑一条，也可能报错

什么时候必须用 GROUP BY 而不能用 DISTINCT？

当你需要在去重基础上附加计算时，GROUP BY 是唯一合法路径。DISTINCT 不支持聚合逻辑，也不能控制“每组保留哪条记录”。

使用场景示例：

查每个部门的员工数：SELECT dept, COUNT(*) FROM emp GROUP BY dept —— DISTINCT 完全无法替代
查每个用户最新一笔订单：SELECT user_id, MAX(created_at) FROM orders GROUP BY user_id —— 这里 MAX() 依赖 GROUP BY 语义
想取每组中某字段最大值对应整行数据？那得嵌套或用窗口函数，DISTINCT 更无能为力

性能差异主要出现在哪里？

执行计划层面，两者底层都常走排序或哈希去重，但优化器处理方式不同：MySQL 8.0+ 对 DISTINCT 可能自动改写为 GROUP BY，而 PostgreSQL 通常对二者生成相同计划；但一旦涉及多列、大偏移或索引缺失，差距就暴露出来。

Veo

Google 最新发布的 AI 视频生成模型

下载

影响性能的关键点：

GROUP BY 若有匹配的复合索引（如 INDEX(a,b)），可避免排序；DISTINCT 同样受益，但某些旧版本优化器不会主动利用
带 ORDER BY 时：SELECT DISTINCT a FROM t ORDER BY a 可能复用索引排序；但 SELECT a FROM t GROUP BY a ORDER BY a 在部分场景下会被强制二次排序
大数据量分页（如 LIMIT 10000,20）时，GROUP BY 因需完整分组常比 DISTINCT 更慢，尤其当分组键基数高、内存不足触发磁盘临时表

容易被忽略的兼容性陷阱

不同数据库对 GROUP BY 的宽松程度差异极大，而 DISTINCT 行为相对统一。这导致看似能跑的 SQL，在迁移时突然失败。

典型坑点：

MySQL 5.7+ 默认开启 ONLY_FULL_GROUP_BY，SELECT a, b FROM t GROUP BY a 报错；但 SQLite、旧版 MySQL 或关闭该模式的实例能运行——结果中 b 值不可控
PostgreSQL 要求 SELECT 列要么在 GROUP BY 中，要么被聚合函数包裹，否则直接拒绝；DISTINCT 没这限制
SQL Server 不允许 SELECT 中出现未分组也未聚合的列，且不支持 GROUP BY 后跟表达式别名（如 GROUP BY col_name AS x），而 DISTINCT 无此语法约束

真正麻烦的不是语法报错，而是同样 SQL 在不同环境返回不同结果——尤其是 b 值随机取某条记录时，业务逻辑可能悄悄出错。

如何限制触发器的执行层数_max_sp_recursion_depth递归深度设置

MySQL 主从复制原理详解

SQL如何避免间隙锁导致的并发下降_降低隔离级别与等值查询

SQL如何避免IN查询走全表扫描_参数数量限制与执行计划突变

MySQL 幻读与不可重复读区别

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

下载

相关标签:

mysql 大数据聚合函数 sql mysql count select Error 严格模式 sqlite postgresql 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 如何实现“分页游标”（cursor-based pagination）避免深分页下一篇：如何用 STRING_AGG / GROUP_CONCAT 实现列转行（聚合字符串）

作者最新文章

SQL并发更新冲突排查_行锁竞争与锁等待分析

2026-03-14 14:28

Nginx利用TCP代理实现Redis集群高可用转发

2026-03-14 14:31

Nginx针对视频资源开启TCP_nopush优化传输

2026-03-14 14:37

Docker仓库公有云集成与企业级镜像管理实践

2026-03-14 14:43

GitHub 命令行怎么用？GitHub CLI 基本操作说明

2026-03-14 14:47

MacOS系统df命令在多版本系统并存时卷组识别

2026-03-14 14:55

Windows运维中手动注册域控相关DNS记录的命令操作

2026-03-14 15:16

DockerDaemon日志滚动策略与磁盘溢出预防

2026-03-14 15:20

JavaScript中Boolean布尔值的逻辑判断与转换规则

2026-03-14 15:23

Java中Apache基础架构中请求处理链的模块化流转

2026-03-14 15:26

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1135

2023.10.12