mysql如何去除重复记录_mysql distinct用法解析

P粉602998670

发布时间：2026-03-16 09:47:03

904人浏览过

来源于php中文网

原创

DISTINCT仅查询去重，不删除原表重复数据；删重应使用ROW_NUMBER()窗口函数（MySQL 8.0+）、自连接（5.7及以下）或换表法，并配索引、备份与唯一约束。

mysql如何去除重复记录_mysql distinct用法解析

用 `DISTINCT` 只是查重，不是删重

很多人一看到“去重”就写 SELECT DISTINCT，结果发现表里重复数据还在——因为 DISTINCT 只影响查询结果，不碰原表。它适合统计、看样例、导出报表，不适合清理脏数据。

常见错误现象：SELECT DISTINCT name, email FROM user_info 返回 100 行，但 SELECT COUNT(*) FROM user_info 还是 500 行，误以为“已经去重成功”。

DISTINCT 作用于整行 SELECT 的字段组合：只有所有字段值完全一致才算重复
如果选了 id（比如 SELECT DISTINCT id, name, email），基本不会去重——因为 id 天然唯一
性能上，DISTINCT 本质是隐式 GROUP BY，大数据量时可能触发临时表和文件排序，变慢

删重复记录，优先用 `ROW_NUMBER()` 窗口函数（MySQL 8.0+）

这是目前最清晰、可控、可读性最强的删除方式，尤其当你需要“按时间保留最新一条”或“按 ID 保留最小一条”时。

实操建议：

先确认 MySQL 版本：SELECT VERSION(); ——低于 8.0 就别硬套，会报错 This version of MySQL doesn't yet support 'LIMIT & IN/ALL/ANY/SOME subquery'

用 CTE + ROW_NUMBER() 安全定位要删的行：

WITH dupes AS (
  SELECT id, ROW_NUMBER() OVER (PARTITION BY name, email ORDER BY id) AS rn
  FROM user_info
)
DELETE FROM user_info WHERE id IN (SELECT id FROM dupes WHERE rn > 1);

PARTITION BY name, email 定义“哪些字段相同算重复”，ORDER BY id 决定哪条留下（升序留最小 ID，降序留最大 ID）

MySQL 5.7 或更低版本？用自连接删除更稳

老版本不支持窗口函数，也不允许 DELETE 中直接子查询引用自身表，NOT IN 套两层 SELECT 虽能绕过，但容易漏删（NULL 导致逻辑失效）、性能差、难调试。

arXiv Xplorer

ArXiv 语义搜索引擎，帮您快速轻松的查找，保存和下载arXiv文章。

下载

推荐做法是自连接，语义直白，引擎优化成熟：

语法简洁：

DELETE e1 FROM user_info e1
INNER JOIN user_info e2 
WHERE e1.id > e2.id AND e1.name = e2.name AND e1.email = e2.email;

它表示：“只要存在另一条 name+email 相同、且 ID 更小的记录，就把当前这条删掉”——天然保留最小 ID
务必确保 (name, email) 上有索引，否则多表扫描极慢；没索引先建：CREATE INDEX idx_name_email ON user_info(name, email);
执行前一定先备份，或在事务里测试：BEGIN; DELETE ... ; SELECT ROW_COUNT(); ROLLBACK;

大批量数据清理，别在原表上硬刚

几百万行以上删重复，无论用哪种 SQL，都可能锁表久、日志暴涨、主从延迟飙升——生产环境风险极高。

稳妥做法是“换表法”，本质是重建：

创建结构一致的新表：CREATE TABLE user_info_clean LIKE user_info;

导入去重后数据（注意：GROUP BY 配合 MIN(id) 等聚合取唯一行）：

INSERT INTO user_info_clean
SELECT MIN(id) AS id, name, email, other_cols
FROM user_info GROUP BY name, email;

原子替换：RENAME TABLE user_info TO user_info_bak, user_info_clean TO user_info;
换完立刻加唯一约束防复发：ALTER TABLE user_info ADD UNIQUE KEY uk_name_email (name, email);

真正容易被忽略的是：换表后外键、触发器、权限、监控指标这些配套项是否同步更新——它们不会自动迁移。

mysql如何为查询设计索引_mysql优化原则说明

mysql如何恢复MyISAM索引文件_mysql repair table应用

mysql开发环境如何快速克隆_mysql数据卷备份与恢复

mysql如何配置CSV引擎进行数据交换_mysql文本表存储应用

mysql如何迁移大数据量表_mysql分片迁移与流量切换

相关标签:

mysql sql mysql NULL count select delete this table

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：mysql中DISTINCT与GROUP BY的性能比较下一篇：暂无

作者最新文章

Edge浏览器麦克风权限怎么开启_Edge浏览器语音输入配置

2026-03-16 09:42

Python匿名函数怎么用_lambda表达式应用场景与语法限制

2026-03-16 09:43

深入理解Oracle高水位线HWM_数据删除后空间未释放的根本原因

2026-03-16 09:44

如何改善面部浮肿_早起按摩与饮食调理的建议

2026-03-16 09:44

如何在Golang中验证依赖包的License合规性 Go语言开源协议检查

2026-03-16 09:45

CSS如何确保样式先于脚本加载_将link标签放在head内并在script之前

2026-03-16 09:45

如何在Golang中实现微服务的全链路压测平台 Go语言压测流量标识处理

2026-03-16 09:46

SQL如何将分组数据拼接成字符串_GROUP_CONCAT与LISTAGG

2026-03-16 09:46

Java中如何读取Properties配置文件_load方法与类路径资源流解析

2026-03-16 09:47

mysql如何去除重复记录_mysql distinct用法解析

2026-03-16 09:47

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1135

2023.10.12