PostgreSQL 如何用 DISTINCT ON 实现分组取最新记录

冷漠man

发布时间：2026-02-05 20:19:02

747人浏览过

来源于php中文网

原创

DISTINCT ON是PostgreSQL特有语法，用于每组保留排序后的首行；而DISTINCT是对整行全字段去重。DISTINCT ON必须与ORDER BY配合，且ORDER BY前导列须与DISTINCT ON列一致并同序。

postgresql 如何用 distinct on 实现分组取最新记录

DISTINCT ON 是什么，和普通 DISTINCT 有什么区别

DISTINCT ON 不是标准 SQL，是 PostgreSQL 特有的语法，用来在去重时保留“每组第一条”记录，而不是像 DISTINCT 那样对整行做全字段比对。它必须配合 ORDER BY 使用，且 ORDER BY 的前导列要和 DISTINCT ON 的列完全一致（顺序也要一致），否则会报错：SELECT DISTINCT ON expressions must match initial ORDER BY expressions。

典型场景是“每个用户取最新一条订单”“每个设备取最近一次上报”——这类需求用 GROUP BY 很难直接满足，因为非分组字段的聚合逻辑不明确；而 DISTINCT ON 能靠排序天然定义“最新”。

怎么写才能正确取出每组最新记录

核心是：把分组字段放在 DISTINCT ON 里，把时间戳/序号字段放在 ORDER BY 的后续位置，并按降序排（DESC）。

DISTINCT ON (user_id) 表示“每个 user_id 只留一行”
ORDER BY user_id, created_at DESC 确保同一 user_id 下，created_at 最大的那条排最前，被 DISTINCT ON 拿到
如果漏掉 user_id 在 ORDER BY 的开头，会直接报错
如果 created_at 允许 NULL，记得加 NULLS LAST，避免 NULL 被当成“最新”

示例：

SELECT DISTINCT ON (user_id) *
FROM orders
ORDER BY user_id, created_at DESC NULLS LAST;

为什么不能只靠 ORDER BY + LIMIT 1？

单独用 ORDER BY created_at DESC LIMIT 1 只能取全局最新一条，不是“每组最新”。有人试图用子查询或窗口函数替代，但 DISTINCT ON 在多数情况下更简洁、可读性更高、执行计划也更可控。

达芬奇

达芬奇——你的AI创作大师

下载

注意几个易错点：

如果分组字段有重复值但没出现在 SELECT 列表里，PostgreSQL 会报错：“column 'xxx' must appear in the GROUP BY clause or be used in an aggregate function” —— 实际上是因为 DISTINCT ON 要求所有非 DISTINCT ON 字段都得在 ORDER BY 中有定义依据，最稳妥做法是把分组字段显式写进 SELECT
没有索引时，ORDER BY user_id, created_at DESC 可能很慢；建议建联合索引：CREATE INDEX idx_user_created ON orders (user_id, created_at DESC);
DISTINCT ON 不支持在视图或物化视图中直接用于 INSERT/UPDATE 目标，仅限 SELECT 场景

和窗口函数 ROW_NUMBER() 对比选哪个

功能上等价，但写法和性能表现不同。窗口函数更通用（比如要取每组第 2 条、倒数第 1 条），但写起来啰嗦：

SELECT * FROM (
  SELECT *, ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY created_at DESC NULLS LAST) rn
  FROM orders
) t WHERE rn = 1;

实际测试中，当数据量大、分组多、排序字段有索引时，DISTINCT ON 通常更快，因为优化器能更早剪枝；而窗口函数必须先算完整个结果集再过滤。但如果需要复用序号做其他判断（比如标记“是否为最新”），窗口函数更灵活。

真正容易被忽略的是：DISTINCT ON 的“第一条”完全依赖 ORDER BY 的稳定性。如果 created_at 有重复，且没用其他字段进一步排序（比如 id DESC），结果可能每次查询不一致 —— 这不是 bug，是设计使然。

如何用分区切换（SWITCH PARTITION）实现历史数据归档

MySQL 分区表交换分区（EXCHANGE PARTITION）的使用场景

SQL 如何排查“死锁” Deadlock detected 的详细日志分析

mdadm RAID rebuild 极慢的 bitmap / speed_limit_min/max 加速参数

SQL 如何用 ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 写法

相关标签:

app 区别为什么 gate sql NULL select function column postgresql bug

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 如何用窗口函数 LAG() 计算上一行差值避免自连接下一篇：暂无

作者最新文章

paki小游戏免费入口快速指南_Poki小游戏免费在线秒玩入口

2026-02-04 14:59

Claude官网入口在哪里？Claude官方网站入口指引

2026-02-04 16:42

Claude官网在哪？Claude官方网站定位指南

2026-02-04 16:46

Python 文件上传与下载的实现要点

2026-02-04 17:05

ppt怎么删除文本框对象_ PPT选中删除文本框详细操作

2026-02-04 17:16

鹅鸭杀官方网站入口鹅鸭杀官网网站在线下载

2026-02-04 17:18

SQL 如何用 ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 写法

2026-02-04 17:27

春晚2026节目单 2026春晚节目单完整版

2026-02-04 17:30

2026春节红包活动大全春节红包最新资讯

2026-02-04 17:37

Vivo云服务官网网址 vivo云服务官网登录

2026-02-04 17:52

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

834

2023.10.12