0

0

PostgreSQL 如何用 DISTINCT ON 实现分组取最新记录

冷漠man

冷漠man

发布时间:2026-02-05 20:19:02

|

747人浏览过

|

来源于php中文网

原创

DISTINCT ON是PostgreSQL特有语法,用于每组保留排序后的首行;而DISTINCT是对整行全字段去重。DISTINCT ON必须与ORDER BY配合,且ORDER BY前导列须与DISTINCT ON列一致并同序。

postgresql 如何用 distinct on 实现分组取最新记录

DISTINCT ON 是什么,和普通 DISTINCT 有什么区别

DISTINCT ON 不是标准 SQL,是 PostgreSQL 特有的语法,用来在去重时保留“每组第一条”记录,而不是像 DISTINCT 那样对整行做全字段比对。它必须配合 ORDER BY 使用,且 ORDER BY 的前导列要和 DISTINCT ON 的列完全一致(顺序也要一致),否则会报错:SELECT DISTINCT ON expressions must match initial ORDER BY expressions

典型场景是“每个用户取最新一条订单”“每个设备取最近一次上报”——这类需求用 GROUP BY 很难直接满足,因为非分组字段的聚合逻辑不明确;而 DISTINCT ON 能靠排序天然定义“最新”。

怎么写才能正确取出每组最新记录

核心是:把分组字段放在 DISTINCT ON 里,把时间戳/序号字段放在 ORDER BY 的后续位置,并按降序排(DESC)。

  • DISTINCT ON (user_id) 表示“每个 user_id 只留一行”
  • ORDER BY user_id, created_at DESC 确保同一 user_id 下,created_at 最大的那条排最前,被 DISTINCT ON 拿到
  • 如果漏掉 user_idORDER BY 的开头,会直接报错
  • 如果 created_at 允许 NULL,记得加 NULLS LAST,避免 NULL 被当成“最新”

示例:

SELECT DISTINCT ON (user_id) *
FROM orders
ORDER BY user_id, created_at DESC NULLS LAST;

为什么不能只靠 ORDER BY + LIMIT 1?

单独用 ORDER BY created_at DESC LIMIT 1 只能取全局最新一条,不是“每组最新”。有人试图用子查询或窗口函数替代,但 DISTINCT ON 在多数情况下更简洁、可读性更高、执行计划也更可控。

达芬奇
达芬奇

达芬奇——你的AI创作大师

下载

注意几个易错点:

  • 如果分组字段有重复值但没出现在 SELECT 列表里,PostgreSQL 会报错:“column 'xxx' must appear in the GROUP BY clause or be used in an aggregate function” —— 实际上是因为 DISTINCT ON 要求所有非 DISTINCT ON 字段都得在 ORDER BY 中有定义依据,最稳妥做法是把分组字段显式写进 SELECT
  • 没有索引时,ORDER BY user_id, created_at DESC 可能很慢;建议建联合索引:CREATE INDEX idx_user_created ON orders (user_id, created_at DESC);
  • DISTINCT ON 不支持在视图或物化视图中直接用于 INSERT/UPDATE 目标,仅限 SELECT 场景

和窗口函数 ROW_NUMBER() 对比选哪个

功能上等价,但写法和性能表现不同。窗口函数更通用(比如要取每组第 2 条、倒数第 1 条),但写起来啰嗦:

SELECT * FROM (
  SELECT *, ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY created_at DESC NULLS LAST) rn
  FROM orders
) t WHERE rn = 1;

实际测试中,当数据量大、分组多、排序字段有索引时,DISTINCT ON 通常更快,因为优化器能更早剪枝;而窗口函数必须先算完整个结果集再过滤。但如果需要复用序号做其他判断(比如标记“是否为最新”),窗口函数更灵活。

真正容易被忽略的是:DISTINCT ON 的“第一条”完全依赖 ORDER BY 的稳定性。如果 created_at 有重复,且没用其他字段进一步排序(比如 id DESC),结果可能每次查询不一致 —— 这不是 bug,是设计使然。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

834

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

330

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

351

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1407

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

365

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

983

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

581

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

429

2024.04.29

java连接字符串方法汇总
java连接字符串方法汇总

本专题整合了java连接字符串教程合集,阅读专题下面的文章了解更多详细操作。

7

2026.02.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Java 教程
Java 教程

共578课时 | 58万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号