DISTINCT是对整行记录去重,依据SELECT字段值组合全匹配判断重复,NULL视为相同,不保证保留哪条记录;不能仅对单字段生效,与GROUP BY本质不同,前者仅去重,后者支持聚合计算。

DISTINCT 是对查询结果的**整行记录**做去重,不是对单个字段单独处理。只要 SELECT 后列出的所有字段值组合完全一致,就被视为重复行,只保留其中一条。
去重的基本逻辑
DISTINCT 判断的是“字段组合的全值匹配”。比如 SELECT DISTINCT city, gender FROM users,只有当 city 和 gender 两个值同时相等时,才算重复。哪怕 city 都是“北京”,但一条是“男”、一条是“女”,这两行都会保留。
- 它不关心原始数据中哪条被留下,也不保证是最早或最新的一条
- NULL 在大多数数据库(如 MySQL)中被视为相同值,多行 NULL 只保留一个
- DISTINCT 作用于整个 SELECT 列表,不能只对其中某一个字段生效
常见误操作与澄清
很多人以为 SELECT DISTINCT name FROM users 能返回“每个名字对应的一条完整用户信息”,这是错的。它只返回 name 这一列的不重复值,其他字段(如 id、email)根本不会出现在结果里,更谈不上保留哪条完整记录。
由于疫情等原因大家都开始习惯了通过互联网上租车服务的信息多方面,且获取方式简便,不管是婚庆用车、旅游租车、还是短租等租车业务。越来越多租车企业都开始主动把租车业务推向给潜在需求客户,所以如何设计一个租车网站,以便在同行中脱颖而出就重要了,易优cms针对租车行业市场需求、目标客户、盈利模式等,进行策划、设计、制作,建设一个符合用户与搜索引擎需求的租车网站源码。 网站首页
- 若需“按 name 去重并取最新一条完整记录”,得用 ROW_NUMBER() OVER (PARTITION BY name ORDER BY create_time DESC) 配合子查询
- SELECT DISTINCT a, b 不等于先对 a 去重、再对 b 去重,而是对 (a,b) 这一对值整体判断
- DISTINCT 不能写在列名中间,必须紧跟在 SELECT 后面,比如 SELECT DISTINCT a, b 正确,SELECT a DISTINCT, b 报错
和 GROUP BY 的区别
DISTINCT 和 GROUP BY a, b 在纯去重效果上可能一样,但本质不同:
- DISTINCT 只输出去重后的原始字段值,不支持聚合计算(如 SUM、AVG)
- GROUP BY 是分组基础,天然可搭配 COUNT、MAX 等函数,比如统计每个部门人数必须用 GROUP BY
- 如果只是要“列出所有不重复的部门+岗位组合”,DISTINCT 更简洁;如果还要算“每个组合有多少人”,就得切到 GROUP BY
性能与实用提醒
DISTINCT 内部通常依赖排序或哈希,数据量大时开销明显:
- 尽量配合 WHERE 先过滤,减少参与去重的数据量
- 避免对长文本字段(如 description)或多个大字段联合去重
- 需要排序结果时,务必显式加 ORDER BY,因为 DISTINCT 本身不保证顺序
- COUNT(DISTINCT user_id) 是统计独立用户的标准写法,效率通常优于先 GROUP BY 再 COUNT









