0

0

mysql如何使用distinct去重_mysql去重操作解析

P粉602998670

P粉602998670

发布时间:2026-03-10 08:35:46

|

824人浏览过

|

来源于php中文网

原创

distinct仅作用于select列表,修饰整行而非单列;不能用于where或order by;null被视为相同值;复杂去重需用group by或row_number()。

mysql如何使用distinct去重_mysql去重操作解析

distinct 只能作用于 select 列表,不能用于 where 或 order by

很多人误以为 DISTINCT 是个独立指令,可以像函数一样“对某列去重”,其实它修饰的是整个 SELECT 行。只要两行在 SELECT 中列出的所有字段组合完全一致,就只保留一行。

常见错误写法:SELECT DISTINCT name, age FROM user WHERE DISTINCT city = 'Beijing' —— 这会直接报错,因为 DISTINCT 不是关键字,不能出现在 WHERE 子句里。

  • DISTINCT 必须紧跟在 SELECT 后面,且只能出现一次
  • 如果选了 SELECT DISTINCT name, age,那么 (张三, 25)(张三, 26) 算两行,不会被去重
  • 想按单列逻辑去重但又想取其他字段?不能靠 DISTINCT 直接实现,得用 GROUP BY 或窗口函数

distinct 和 group by 在语义和性能上并不等价

DISTINCT 看似简单,但 MySQL 内部常把它重写为隐式 GROUP BY(尤其在有聚合函数时),而显式 GROUP BY 允许你控制聚合逻辑、使用 ANY_VALUE()MIN()/MAX() 选取代表值。

例如:要取每个 city 下任意一条用户记录(含 id、name、age):

SELECT DISTINCT city, name, age FROM user;

这并不能保证“每个 city 只返回一条”,因为 city 相同但 nameage 不同时仍会多行;真正想要的其实是:

微软爱写作
微软爱写作

微软出品的免费英文写作/辅助/批改/评分工具

下载
SELECT city, ANY_VALUE(name), ANY_VALUE(age) FROM user GROUP BY city;
  • MySQL 5.7+ 开启 ONLY_FULL_GROUP_BY 时,SELECT city, name FROM user GROUP BY city 会报错,必须对非分组列用聚合函数包裹
  • ANY_VALUE() 是最轻量的“选一个就行”的方式,不保证稳定性,但性能好
  • DISTINCT 无法表达“每组取最新一条”这种需求,必须配合子查询或 ROW_NUMBER()(MySQL 8.0+)

distinct 对 null 值的处理:多个 null 被视为相同

这是容易被忽略的细节:NULLDISTINCT 中被当作相等值处理。比如:

SELECT DISTINCT status FROM orders;

status'paid''shipped'NULLNULL,结果只有三行 —— 所有 NULL 合并为一个。

  • 这点和 GROUP BY 一致,但和 ORDER BY 不同(ORDER BY col ASCNULL 默认排最前)
  • 如果业务上需要区分“未填”和“明确为空”,建议用字符串如 'unknown' 替代 NULL,避免去重逻辑意外吞掉数据
  • 联合去重时,(1, NULL)(1, NULL) 被去重,但 (1, NULL)(1, 'a') 不会被去重

替代 distinct 的更可控方案:row_number() + 子查询(MySQL 8.0+)

当你要“每个分组取最新/最早/指定排序下的一条”,DISTINCT 完全无能为力,必须换思路。

例如:每个 user_id 取最新一条订单(按 created_at 降序):

SELECT user_id, order_no, created_at
FROM (
  SELECT user_id, order_no, created_at,
         ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY created_at DESC) AS rn
  FROM orders
) t
WHERE rn = 1;
  • 这个模式比 GROUP BY + MAX(created_at) 再关联原表更简洁,也避免了关联丢失字段的风险
  • 注意 ROW_NUMBER() 是窗口函数,必须在子查询或 CTE 中使用,不能直接在外部 WHERE 里引用别名 rn
  • 如果用的是 MySQL 5.7 或更低版本,只能用自连接或相关子查询,性能差很多,建议升级或加索引优化
实际去重操作中最容易卡住的地方,不是语法写不对,而是没想清楚“到底要按什么维度去重”以及“其他字段怎么选”。DISTINCT 只解决“整行唯一”这一种情况,稍复杂一点的业务场景,就得切换到 GROUP BY 或窗口函数。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
mysql修改数据表名
mysql修改数据表名

MySQL修改数据表:1、首先查看数据库中所有的表,代码为:‘SHOW TABLES;’;2、修改表名,代码为:‘ALTER TABLE 旧表名 RENAME [TO] 新表名;’。php中文网还提供MySQL的相关下载、相关课程等内容,供大家免费下载使用。

686

2023.06.20

MySQL创建存储过程
MySQL创建存储过程

存储程序可以分为存储过程和函数,MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名),也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容,供大家免费下载使用。

493

2023.06.21

mongodb和mysql的区别
mongodb和mysql的区别

mongodb和mysql的区别:1、数据模型;2、查询语言;3、扩展性和性能;4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容,供大家免费下载体验。

287

2023.07.18

mysql密码忘了怎么查看
mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

519

2023.07.19

mysql创建数据库
mysql创建数据库

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

267

2023.07.25

mysql默认事务隔离级别
mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统,它支持事务处理。事务是一组数据库操作,它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性,MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

392

2023.08.08

sqlserver和mysql区别
sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途,但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

542

2023.08.11

mysql忘记密码
mysql忘记密码

MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢?php中文网给大家带来了相关的教程以及其他关于mysql的文章,欢迎大家前来学习阅读。

666

2023.08.14

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

59

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 2.5万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 845人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号