SQL去重查询怎么实现_真实案例解析强化复杂查询思维【教程】

冰川箭仙

发布时间：2025-12-23 22:28:02

904人浏览过

来源于php中文网

原创

SQL去重核心是DISTINCT与GROUP BY：DISTINCT用于整行或列组合的简单去重，不可控保留任意一条；GROUP BY配合聚合函数或窗口函数可按业务逻辑保留最新、最大等特定记录，支持复杂需求。

sql去重查询怎么实现_真实案例解析强化复杂查询思维【教程】

SQL去重查询核心就两条路：用 DISTINCT 快速筛掉重复行，或用 GROUP BY 配合聚合函数做更灵活的“逻辑去重”。关键不在语法本身，而在你到底想保留哪一条——是任意一条？最新的一条？金额最大的那条？选错方法，结果就偏了。

直接去重：DISTINCT 最快但最“粗暴”

DISTINCT 作用在整行（或指定列组合）上，只要值完全相同，就只留一条。适合真正要“删重记录”的场景，比如查所有不重复的用户城市：

SELECT DISTINCT city FROM users;
如果想按多个字段去重（比如同一城市+同一职业只算一次），写成 SELECT DISTINCT city, job_title FROM users;
注意：DISTINCT 不能和普通列、聚合函数混用（除非全用聚合），也无法指定保留哪条重复数据——它内部按排序或存储顺序随机取，不可控。

按条件保留：GROUP BY + 聚合函数才是真功夫

当你要“每个用户只取最新订单”“每类产品只取价格最高的SKU”，就得靠 GROUP BY 搭配 MAX()、MIN()、ROW_NUMBER() 等。这才是业务中高频又易错的点：

查每个用户的最新下单时间：SELECT user_id, MAX(order_time) FROM orders GROUP BY user_id;
但如果你还要同时拿到那条完整订单记录（比如订单号、商品名），就不能只靠 MAX()——得用窗口函数：
SELECT * FROM (SELECT *, ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY order_time DESC) rn FROM orders) t WHERE rn = 1;
小技巧：GROUP BY 后 SELECT 的非聚合列必须出现在 GROUP BY 子句里（MySQL 5.7+ 默认严格模式下），否则报错或结果不可靠。

去重后还要统计？别漏掉 COUNT(DISTINCT …)

统计“有多少个不同城市”“多少个活跃品类”，不是先 DISTINCT 再 COUNT，而是直接用 COUNT(DISTINCT ...)，既简洁又高效：

Cursor

一个新的IDE，使用AI来帮助您重构、理解、调试和编写代码。

下载

SELECT COUNT(DISTINCT city) AS city_count FROM users;
支持多列组合去重计数：COUNT(DISTINCT user_id, product_id) 表示“有多少个不同的用户-商品组合”；
注意 NULL 值会被自动忽略——如果业务要求把 NULL 当作一种有效取值，得额外处理（比如用 COALESCE 转成字符串）。

真实踩坑提醒：NULL 和空字符串不是一回事

很多人以为 DISTINCT 会把 NULL 当成相同值合并——确实会。但空字符串 '' 和 NULL 在 SQL 里是两个完全不同的值，DISTINCT 不会把它们当重复项处理。实际查用户地址时，可能看到一堆 '' 和一堆 NULL 并存，都算“不同”：

查去重后的地址值，得提前清洗：SELECT DISTINCT COALESCE(NULLIF(trim(address), ''), '未知') FROM users;
GROUP BY 时同理，NULL 会自成一组，可能影响分组总数，务必结合业务确认是否合理。

基本上就这些。去重看着简单，一到关联多表、带时间范围、要保原始字段，立刻变复杂。关键是先想清楚：“我要去的是什么层面的重？”——是行重、逻辑重，还是统计口径上的重？想清这点，语法只是手到擒来的工具。

SQL如何实现全外连接_FULL OUTER JOIN与左右连接合并

MySQL如何实现全量与增量备份_mysqldump工具与binlog结合

MySQL如何实现级联复制_A到B到C架构设计与log_slave_updates

SQL如何在不加锁的情况下读取数据_快照读与当前读的区别

MySQL如何锁定恶意登录的用户账号_ACCOUNT LOCK与失败次数策略

相关标签:

mysql 工具聚合函数 sql mysql NULL count select 字符串堆严格模式

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL模型字典表设计方案_SQL统一配置来源结构下一篇：SQL时间序列统计怎么处理_关键概念讲透让学习更加顺畅【技巧】

作者最新文章

华为荣耀价格最低的一款手机荣耀最便宜机型价格解析

2026-03-11 09:37

微信电脑版文件保存在哪个文件夹微信电脑版文件默认存储路径

2026-03-11 11:40

Linux配置集中管理_配置统一方案

2026-03-11 11:50

Linux服务器频繁重启_硬件与系统排查

2026-03-11 12:11

Adobe怎么把一页拆分成两页 Adobe PDF页面拆分方法

2026-03-11 12:17

Linux系统内核参数查看_sysctl命令详解

2026-03-11 12:27

SQL报表指标口径变更_版本化设计

2026-03-11 12:34

Linux 反向代理性能优化_Nginx网络调优

2026-03-11 13:05

GitHub 网址打不开怎么解决？网络与 DNS 排查方法

2026-03-11 13:44

腾讯会议屏幕比例怎么调

2026-03-11 14:17

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1134

2023.10.12