GROUP BY + HAVING COUNT(*) > 1 如何找出重复记录并保留最新一条

舞夢輝影

发布时间：2026-01-30 18:02:40

389人浏览过

来源于php中文网

原创

正确做法是用LEFT JOIN派生表保留最大id：DELETE t1 FROM app_wine t1 LEFT JOIN (SELECT item_id, MAX(id) AS max_id FROM app_wine GROUP BY item_id) t2 ON t1.item_id = t2.item_id AND t1.id = t2.max_id WHERE t2.max_id IS NULL。

group by + having count(*) > 1 如何找出重复记录并保留最新一条

查重复数据：GROUP BY + HAVING COUNT(*) > 1 是对的，但只是第一步

这条语句本身没错，SELECT item_id, COUNT(*) FROM app_wine GROUP BY item_id HAVING COUNT(*) > 1 确实能快速定位哪些 item_id 存在重复。但它只告诉你“有重复”，不告诉你“哪条是最新”，更不能直接删旧留新。很多人卡在这一步，误以为查出来就能删——其实这只是诊断，不是治疗。

删旧留新必须绕开 MySQL 的 “You can't specify target table for update in FROM clause” 错误

想直接写 DELETE FROM app_wine WHERE id NOT IN (SELECT MAX(id) FROM app_wine GROUP BY item_id)？MySQL 会报错：You can't specify target table 'app_wine' for update in FROM clause。这是 MySQL 的硬性限制：不能在子查询里直接读写同一张表。

正确做法是把子查询结果“垫一层”——用派生表（即加个临时别名）绕过校验
推荐写法：DELETE t1 FROM app_wine t1 LEFT JOIN (SELECT item_id, MAX(id) AS max_id FROM app_wine GROUP BY item_id) t2 ON t1.item_id = t2.item_id AND t1.id = t2.max_id WHERE t2.max_id IS NULL
等价但更易读的写法（用 NOT IN + 派生表）：DELETE FROM app_wine WHERE id NOT IN (SELECT max_id FROM (SELECT MAX(id) AS max_id FROM app_wine GROUP BY item_id) AS tmp)

按时间字段保留最新，别只认 `id` —— 除非你确定它严格递增且代表插入顺序

很多业务表的 id 是自增主键，看起来“越大越新”，但要注意：如果存在批量导入、历史补录、或手动指定 id 的情况，MAX(id) 就不可靠。此时应优先依赖明确的时间字段，比如 created_at 或 update_time。

万知

万知: 你的个人AI工作站

下载

用时间保留最新：SELECT item_id, MAX(created_at) FROM app_wine GROUP BY item_id HAVING COUNT(*) > 1
删除时关联时间最大值：DELETE t1 FROM app_wine t1 INNER JOIN app_wine t2 ON t1.item_id = t2.item_id AND t1.created_at
注意：这种写法会删掉所有“非最大时间”的记录，包括同时间多条——若存在毫秒级重复且需保一条，得额外加 id 辅助去重

执行前务必备份，且先用 SELECT 验证将删哪些行

删操作不可逆。千万别跳过验证步骤。哪怕表不大，也该先跑一遍“模拟删除”的 SELECT：

SELECT * FROM app_wine WHERE id NOT IN (SELECT max_id FROM (SELECT MAX(id) AS max_id FROM app_wine GROUP BY item_id) AS tmp)
检查返回结果是否全是预期要删的旧数据；确认数量合理（比如重复 50 条，应删 49 条）
线上环境建议加 LIMIT 分批删（如 DELETE ... LIMIT 1000），避免长事务锁表

真正容易被忽略的点是：GROUP BY 去重逻辑依赖字段组合是否完整。比如你想按 item_id + sku 去重，却只写了 GROUP BY item_id，那就会误删本不该合并的记录——动手前，先想清楚“什么是你的业务意义上的‘重复’”。

SQL 如何处理死锁（Deadlock found when trying to get lock）

LOAD DATA LOCAL INFILE 的安全风险与 --local-infile=0 配置

MySQL max_connections 与 thread_cache_size 的调优经验

MySQL type=ALL / index / ref / eq_ref / range 的实际含义对比

SQL 慢查询日志开启后如何用 pt-query-digest 分析

相关标签:

mysql app win sql mysql NULL count for select delete table

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 如何实现“去重后取前 N 条”且保持原顺序下一篇：SQL 如何处理死锁（Deadlock found when trying to get lock）

作者最新文章

iSCSI session 频繁 logout/login 的 timeout / MPIO / queue_depth 配置

2026-01-29 12:00

Apple 在港正式推出新代 AirTag 物品追蹤工具！卖 $249 更强精準寻找，一图分清较前代有何改进

2026-01-29 12:06

DeepSeek提示词设计 DeepSeek提示词创意设计方法

2026-01-29 12:38

大量残留 netns 的 ip netns list | xargs -n1 ip netns delete 脚本

2026-01-29 13:54

Chrome 浏览器官方下载入口在哪？Chrome 浏览器官方下载入口中文

2026-01-29 13:54

window如何本地部署Clawdbot windows安装Clawdbot指南

2026-01-29 14:00

手把手教你使用 Clawdbot 部署telegram助手

2026-01-29 14:04

豆包网页版入口直达步骤豆包网页版怎么用

2026-01-29 14:11

nftables 规则加载成功但流量不匹配的 hook / priority 问题

2026-01-29 14:15

nft list ruleset 不显示新规则的 table / chain / priority 冲突

2026-01-29 14:26

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

749

2023.10.12