正确做法是按年月分组并倒序编号取首条:PostgreSQL用DATE_TRUNC('month', created_at),MySQL用YEAR/MONTH,SQL Server用DATEFROMPARTS构造月分区;过滤条件须在窗口函数前完成,避免逻辑错误;时间并列时应先聚合再关联确保结果确定。

用 ROW_NUMBER() 按月分组倒序编号
核心是把数据按年月分组,再在每组内按时间从新到旧排号,取序号为 1 的那条。注意必须用 DATE_TRUNC('month', created_at)(PostgreSQL)或 YEAR(created_at), MONTH(created_at)(MySQL)做分区依据,不能只用 MONTH(created_at)——否则不同年份的 12 月会被混在一起。
常见错误:直接 ORDER BY created_at DESC 却忘了 PARTITION BY 要覆盖年和月两个维度。结果是跨年数据错乱,比如 2023-12-31 和 2024-12-25 被当成同一组。
- PostgreSQL 示例:
SELECT * FROM ( SELECT *, ROW_NUMBER() OVER ( PARTITION BY DATE_TRUNC('month', created_at) ORDER BY created_at DESC ) AS rn FROM orders ) t WHERE rn = 1; - MySQL 8.0+ 示例:
SELECT * FROM ( SELECT *, ROW_NUMBER() OVER ( PARTITION BY YEAR(created_at), MONTH(created_at) ORDER BY created_at DESC ) AS rn FROM orders ) t WHERE rn = 1;
遇到并列时间时用 MAX(created_at) 先聚合
如果某个月最后一天有多条记录时间完全相同(比如批量导入、毫秒级时间戳未写入),ROW_NUMBER() 会随机选一条,不可控。这时得先按月求出最大时间,再关联原表捞出对应记录。
性能影响明显:子查询 + 关联比纯窗口函数多一次扫描,但结果确定。尤其当表有复合索引 (year, month, created_at) 或 (created_at) 时,这个写法反而更稳。
- 安全写法(通用):
SELECT o.* FROM orders o INNER JOIN ( SELECT EXTRACT(YEAR FROM created_at) y, EXTRACT(MONTH FROM created_at) m, MAX(created_at) max_time FROM orders GROUP BY y, m ) m ON EXTRACT(YEAR FROM o.created_at) = m.y AND EXTRACT(MONTH FROM o.created_at) = m.m AND o.created_at = m.max_time;
SQL Server 用 DATEFROMPARTS() 避免字符串拼接陷阱
SQL Server 没有 DATE_TRUNC,有人会用 CONVERT(CHAR(7), created_at, 120) 截取 “YYYY-MM”,但这是字符串操作,无法走日期索引,且时区处理易出错。更可靠的是用 DATEFROMPARTS(YEAR(created_at), MONTH(created_at), 1) 构造当月第一天,再参与分区。
注意:SQL Server 的 ROW_NUMBER() 窗口里不能直接用表达式做 PARTITION BY,得先在 CTE 或子查询里算好字段。
- 推荐写法:
WITH monthly AS ( SELECT *, DATEFROMPARTS(YEAR(created_at), MONTH(created_at), 1) AS month_start FROM orders ) SELECT * FROM ( SELECT *, ROW_NUMBER() OVER ( PARTITION BY month_start ORDER BY created_at DESC ) AS rn FROM monthly ) t WHERE rn = 1;
WHERE 条件必须写在窗口外,否则逻辑失效
很多人想先过滤再取最后一条,就把 WHERE status = 'paid' 放在窗口子查询里——这没问题;但如果误写成在最外层 WHERE 过滤,就等于先取了每月最后一条,再筛状态,结果可能某个月压根没付费单,却返回空。顺序错了。
真正要“每月最后一条付费记录”,过滤必须在窗口计算前完成,确保分区数据源已缩小范围。否则窗口函数看到的是全量数据,最后筛选只是丢弃结果,不改变分区逻辑。
- 正确位置:
SELECT * FROM ( SELECT *, ROW_NUMBER() OVER ( PARTITION BY DATE_TRUNC('month', created_at) ORDER BY created_at DESC ) AS rn FROM orders WHERE status = 'paid' -- ✅ 这里过滤 ) t WHERE rn = 1; - 错误写法:
SELECT * FROM ( SELECT *, ROW_NUMBER() OVER (...) FROM orders ) t WHERE rn = 1 AND status = 'paid'; -- ❌ 可能无结果
时间精度、分区键一致性、过滤时机——这三个地方一动,结果就偏。别信“差不多”,尤其在对账或报表场景里。










