0

0

SQL LAG / LEAD / FIRST_VALUE / LAST_VALUE 的时序分析经典写法

舞夢輝影

舞夢輝影

发布时间:2026-02-10 19:33:09

|

352人浏览过

|

来源于php中文网

原创

LAG和LEAD必须同时配PARTITION BY与ORDER BY才可靠:缺PARTITION BY则全表成一区,缺ORDER BY则行为未定义;FIRST_VALUE/LAST_VALUE默认帧不覆盖全分区,需显式声明ROWS UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING。

sql lag / lead / first_value / last_value 的时序分析经典写法

LAG 和 LEAD 必须配 PARTITION BY + ORDER BY 才可靠

不加 PARTITION BY 时,整个结果集被当成一个分区;漏掉 ORDER BY 则行为未定义——多数数据库(如 PostgreSQL、SQL Server)会报错,MySQL 8.0+ 虽允许但返回随机行偏移,结果不可复现。

  • 业务场景中,90% 的错误源于只写 ORDER BY 却忽略 PARTITION BY:比如查每个用户最近两次登录间隔,没按 user_id 分区,就会跨用户取值
  • LAG(col, 1) 默认取前 1 行,但若上一行不在同一分区内(例如分区边界),返回 NULL —— 这是正确行为,不是 bug
  • 性能上,窗口函数依赖排序,ORDER BY 字段必须有索引,否则大表查询可能慢几秒甚至超时

FIRST_VALUE / LAST_VALUE 默认是 RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW

这个默认窗口帧(frame)常导致误解:比如想取“每个分组第一条记录的金额”,却在 ORDER BY create_time 下用了 FIRST_VALUE(amount),结果拿到的是当前行之前(含当前行)最小时间对应的值,而非整个分区的第一条。

  • 要取整个分区首/尾,必须显式声明 ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING
  • PostgreSQL 和 Oracle 支持简写 ROWS UNBOUNDED,但 MySQL 8.0+ 不支持,必须写全
  • LAST_VALUE 尤其危险:不改 frame 时,它几乎总等于当前行值,因为默认范围不包含后续行

LEAD(n) 超出分区末尾返回 NULL,但不能靠它判断“是否为最后一条”

有人用 LEAD(id) IS NULL 当作“当前行是该用户最后一条记录”的条件,这在单分区、严格按时间排序时看似可行,但实际脆弱。

CreateWise AI
CreateWise AI

为播客创作者设计的AI创作工具,AI自动去口癖、提交亮点和生成Show notes、标题等

下载
  • 如果存在并列时间(create_time 相同),ORDER BY create_time 无法保证稳定排序,LEAD 可能跳过或错位
  • 更可靠的方式是配合 ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY create_time DESC),然后筛 rn = 1
  • 另外,LEAD(col, 2) 在倒数第二行会返回 NULL,不是因为数据缺失,而是因为没有“后两行”——这点容易被当成脏数据误处理

时序分析中混用聚合和窗口函数容易触发 SQL 错误

比如写 SELECT user_id, AVG(LAG(amount)) OVER (...) FROM t,MySQL 和 PostgreSQL 都会报错:Window function is not allowed in aggregation

  • 窗口函数不能嵌套在聚合函数里,也不能出现在 GROUP BY 子句或 HAVING 条件中(除非外层是窗口)
  • 常见替代:先用子查询或 CTE 算出 LAG 值,再对外层结果做 AVG
  • BigQuery 允许 AVG(LEAD(x)) OVER(...),但这是特例,别默认其他引擎也支持
时序分析真正卡住人的地方,往往不是语法记不住,而是默认窗口帧、排序稳定性、NULL 边界这些隐含规则在不同数据库里的细微差异——调通一条语句后,换环境或加个索引,就可能跑出不一样结果。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

899

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

333

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

372

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1530

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

367

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1107

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

583

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

432

2024.04.29

包子漫画网页版入口与全集阅读指南_正版免费漫画快速访问方法
包子漫画网页版入口与全集阅读指南_正版免费漫画快速访问方法

本专题汇总了包子漫画官网和网页版入口,提供最新章节抢先看方法、正版免费阅读指南,以及稳定访问方式,帮助用户快速直达包子漫画页面,无广告畅享全集漫画内容。

44

2026.02.10

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号