SQL DISTINCT 去重操作原理与实践

冰川箭仙

发布时间：2026-02-16 18:12:02

597人浏览过

来源于php中文网

原创

select distinct 是对整行去重，作用于 select 后所有列组成的组合值；想单独取某列唯一值需单独查询；null 被视为相同值但组合中任一列不同即算不重复；其本质是查询末期的逻辑过滤，不修改原表；执行机制依数据量与数据库而定，可排序、哈希或索引扫描；order by 列必须出现在 select distinct 中；group by 在性能和扩展性上通常优于 distinct。

sql distinct 去重操作原理与实践

SELECT DISTINCT 是对整行去重，不是对单列

DISTINCT 作用的是 SELECT 后面所有列构成的“组合值”，只要任意一列不同，就算不重复。很多人写 SELECT DISTINCT a, b FROM t 却以为能分别拿到 a 的所有唯一值和 b 的所有唯一值——这是错的，它只返回 (a,b) 这个元组的唯一组合。

想单独取 a 的所有不同值？必须写成 SELECT DISTINCT a FROM t
想同时拿到 a 唯一值、b 唯一值、c 唯一值？不能靠一个 DISTINCT 实现，得拆成三个查询，或用 UNION 拼接（注意类型兼容）
NULL 被视为相同值：多行中若 a 列都是 NULL，DISTINCT 只保留一行；但 (NULL, 1) 和 (NULL, 2) 是不同组合，都会保留

去重不是删数据，而是执行时动态筛行

DISTINCT 不会修改原表，也不生成临时表（除非内存不够），它是在查询执行末期对结果集做的一次逻辑过滤。底层怎么筛，取决于数据库实际选择的机制：

小数据量、无索引、无哈希支持（如旧版 MySQL 5.7）→ 默认走 排序去重：先 ORDER BY 所有 SELECT 列，再顺序扫描跳过相邻重复行；磁盘排序可能拖慢速度
大数据量、内存充足、支持哈希（PostgreSQL ≥9.6 / SQL Server）→ 常选 哈希去重：建哈希表存已见 key，重复直接丢；快但吃内存，OOM 时可能降级为落盘哈希或回退排序
如果 DISTINCT 列上有唯一索引或前导覆盖索引（如查 user_id，而索引是 (status, user_id)），优化器可能直接索引扫描，天然跳过重复——这时连哈希/排序都省了

ORDER BY 和 DISTINCT 共用时，字段必须被包含

标准 SQL 要求：ORDER BY 的列必须出现在 SELECT DISTINCT 的列列表中，否则报错或行为不可靠（MySQL 5.7 兼容模式下可能允许，但 PostgreSQL/SQL Server 会直接拒绝）。

.net全诚外卖通之预订版

预订版是外卖通系列软件之一，此版本和专业外卖版不一样，专业预订版侧重于餐饮业在线预订的实现。平台为用户提供大量的餐饮数据，由于人们对吃的要求苛刻与不通，用户不用在为去哪里吃饭而发愁，用户可以通过平台筛选就餐目标，然后执行预订操作；平台作为就餐者和商家的介质，从平台预订的可以享受一定的折扣，消费者同样可以从预订结果中获得一定的积分收入；同样，和外卖版一样，集成了短信通知、广告管理、专题管理、推广、多

下载

合法：SELECT DISTINCT dept FROM employees ORDER BY dept
非法：SELECT DISTINCT dept FROM employees ORDER BY hire_date（hire_date 没在 SELECT 列表里）
想按某列排序但又不想显示它？不行。要么加进 SELECT（哪怕只是冗余），要么改用子查询或窗口函数

大数据量下，DISTINCT 很可能比 GROUP BY 慢

单纯去重时，GROUP BY 和 DISTINCT 语义等价，但执行计划常更优——因为优化器对 GROUP BY 的路径探索更充分，尤其当涉及聚合倾向（哪怕没写聚合函数）或已有分组索引时。

推荐写法：SELECT dept FROM employees GROUP BY dept，而非 SELECT DISTINCT dept FROM employees
如果后续要加统计（如每个部门人数），GROUP BY 只需补 COUNT(*)，DISTINCT 就得重写逻辑
注意：某些场景下 GROUP BY 会强制排序（如 MySQL 8.0 默认），若不需要有序结果，可加 ORDER BY NULL 显式关闭

真正难的不是写对语法，而是判断“这个去重到底是不是必须发生在 SQL 层”——比如前端展示需要去重，但原始数据本就来自多个 UNION 查询，重复是合并引入的，那前置去重或应用层 dedupe 可能更轻量。别让数据库替你承担不该担的逻辑。

相关标签:

sql mysql NULL count select union postgresql 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 聚合函数 SUM、AVG、COUNT 使用优化下一篇：暂无

作者最新文章

GitHub 怎么运行别人的代码？GitHub 项目运行完整流程讲解

2026-02-16 12:41

扫描全能王怎么下载pdf文件_扫描全能王文档导出PDF教程

2026-02-16 12:49

Python 闰秒处理的正确姿势

2026-02-16 12:55

微信电脑怎么登录没有手机微信电脑无手机登录方法

2026-02-16 13:13

浏览器f12开发者工具使用教程元素审查、Network抓包与Console调试入门

2026-02-16 13:20

Linux 源列表管理与优化策略

2026-02-16 13:42

edge浏览器同步历史记录同步范围与隐私选项说明

2026-02-16 13:52

Python mock 过度使用的问题分析

2026-02-16 13:59

SQL XA 分布式事务的二阶段提交与单机事务性能代价权衡

2026-02-16 14:05

Linux chmod、chown、chgrp 使用技巧

2026-02-16 14:21

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

963

2023.10.12