SQL重复数据面试题_去重与唯一约束考点

冷炫風刃

发布时间：2026-03-09 15:36:13

517人浏览过

来源于php中文网

原创

面试sql重复数据问题需分清查重、去重、防重、修复四场景：查重用group by+having或窗口函数；临时去重用distinct或row_number()；永久删除用子查询保留min(id)；预防靠unique约束或唯一索引，应用层校验须兜底。

sql重复数据面试题_去重与唯一约束考点

面试中遇到SQL重复数据问题，核心是分清场景：是查重、去重、防止重复，还是修复已有重复。关键不在写多炫的语句，而在理解业务意图和数据一致性要求。

一、怎么快速查出表里有哪些重复数据？

先定位问题，再处理。用GROUP BY + HAVING是最直接的方式，重点看重复依据字段（比如姓名+手机号组合）：

查出所有重复的“姓名+邮箱”组合，并统计次数：
SELECT name, email, COUNT(*) FROM users GROUP BY name, email HAVING COUNT(*) > 1;
想看到重复行的完整记录（含ID），可用窗口函数（MySQL 8.0+/PostgreSQL/SQL Server支持）：
SELECT * FROM (SELECT *, COUNT(*) OVER (PARTITION BY name, email) AS cnt FROM users) t WHERE cnt > 1;

二、临时去重：只查不改，返回无重复的结果集

业务查询需要“去重后展示”，但不能删数据——这时不用DELETE，优先考虑逻辑去重：

Midjourney

当前最火的AI绘图生成工具，可以根据文本提示生成华丽的视觉图片。

下载

DISTINCT：适用于整行完全相同（所有字段都一样）：
SELECT DISTINCT name, email FROM users;
ROW_NUMBER()：按某规则取每组第一条（如保留最新注册的用户）：
SELECT * FROM (SELECT *, ROW_NUMBER() OVER (PARTITION BY name, email ORDER BY id DESC) rn FROM users) t WHERE rn = 1;
注意：GROUP BY也能“聚合去重”，但必须明确非分组字段的聚合逻辑（如MAX(id)），否则报错或结果不可控。

三、永久去重：删除已有重复，只留一条

操作前务必备份！真实删除要谨慎，推荐用子查询或CTE锚定保留行：

MySQL常用自连删除（保留最小id）：
DELETE u1 FROM users u1 INNER JOIN users u2 WHERE u1.name = u2.name AND u1.email = u2.email AND u1.id > u2.id;
通用安全写法（推荐）：先查出要删的ID，再删：
DELETE FROM users WHERE id NOT IN (SELECT MIN(id) FROM users GROUP BY name, email);
（注意：若GROUP BY字段含NULL，需额外处理，因NULL != NULL）

四、预防重复：唯一约束 vs 唯一索引 vs 应用层校验

面试常考设计权衡。根本解法是数据库层面加固：

UNIQUE约束：建表时加，或后期ALTER，失败时抛异常（如“Duplicate entry”），开发需捕获并提示用户；
唯一索引：效果同UNIQUE约束，但可包含NULL（多数引擎允许多个NULL），且支持联合、前缀等高级用法；
应用层校验（如先SELECT再INSERT）有竞态风险，高并发下可能仍插入重复——必须配合数据库约束兜底；
扩展思考：若业务允许“软重复”（如同一人多个账号），但需标记主账号，则用外键+标志位，而非强行唯一。

不复杂但容易忽略：NULL值在唯一性判断中的特殊行为、字符集排序规则对比较的影响、以及批量导入时约束是否启用（SET FOREIGN_KEY_CHECKS=0等）。真正考察的是你有没有踩过坑、想过边界。

相关标签:

sql mysql NULL count select delete 并发 postgresql 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL索引碎片率过高_索引重建与整理策略下一篇：SQL TimescaleDB 的 continuous aggregate 的 lag 与刷新间隔

作者最新文章

Python异步阻塞IO问题_IO阻塞排查思路

2026-03-08 13:58

Linux权限不足怎么解决_权限模型与排错思路

2026-03-08 14:01

PHP 数据库读写压力分摊设计

2026-03-08 14:02

摺屏手机免贴膜时代：HONOR Magic V6 首发 4 合 1 氮化硅萤幕技术!

2026-03-08 14:07

PHP 数据库分片算法设计解析

2026-03-08 14:10

Linux软件源配置方法_镜像源更换技巧

2026-03-08 14:16

Linux定时任务并发冲突_cron并发问题治理

2026-03-08 14:17

MySQL 半同步复制机制解析

2026-03-08 14:41

SQL报表复杂表达式慢_表达式提前计算策略

2026-03-08 15:09

Python阻塞IO与非阻塞IO区别_模型解析

2026-03-08 15:10

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1133

2023.10.12

SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

340

2023.10.27

SQL中months_between使用方法

在SQL中，MONTHS_BETWEEN 是一个常见的函数，用于计算两个日期之间的月份差。想了解更多SQL的相关内容，可以阅读本专题下面的文章。

381

2024.02.23

SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容，可以阅读本专题下面的文章。

2109

2024.03.06

sql procedure语法错误解决方法

sql procedure语法错误解决办法：1、仔细检查错误消息；2、检查语法规则；3、检查括号和引号；4、检查变量和参数；5、检查关键字和函数；6、逐步调试；7、参考文档和示例。想了解更多语法错误的相关内容，可以阅读本专题下面的文章。

380

2024.03.06

oracle数据库运行sql方法

运行sql步骤包括：打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果，错误消息或退出sql plus。想了解更多oracle数据库的相关内容，可以阅读本专题下面的文章。

1642

2024.04.07

sql中where的含义

sql中where子句用于从表中过滤数据，它基于指定条件选择特定的行。想了解更多where的相关内容，可以阅读本专题下面的文章。

585

2024.04.29

sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name；该语句将永久删除指定表的表和数据。想了解更多sql的相关内容，可以阅读本专题下面的文章。

439

2024.04.29

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

热门下载

网站特效

网站源码

网站素材

前端模板