窗口函数可在不减少行数的情况下进行分组、排序和聚合计算,其语法为SELECT 列名, 窗口函数() OVER (PARTITION BY 分组列 ORDER BY 排序列 ROWS/RANGE 范围) FROM 表名;PARTITION BY 用于分组,ORDER BY 定义顺序,ROWS/RANGE 指定行范围;常用函数包括ROW_NUMBER()(分配唯一序号)、RANK()/DENSE_RANK()(排名)、SUM()/AVG()/MAX()/MIN()(累计或移动计算)、LAG()/LEAD()(前后行数据访问);例如按部门工资排名:SELECT name, dept, salary, ROW_NUMBER() OVER (PARTITION BY dept ORDER BY salary DESC) AS rank_in_dept FROM employees;计算部门工资占比:SELECT name, dept, salary, ROUND((salary * 1.0)/SUM(salary) OVER (PARTITION BY dept), 2) AS ratio_of_dept FROM employees;累计销售额:SELECT sale_date, amount, SUM(amount) OVER (ORDER BY sale_date) AS cumulated_total FROM sales;使用时需注意:必须有OVER(),否则变为普通聚合;无PARTITION BY则全表为一窗口;ORDER BY影响结果准确性;可用ROWS BETWEEN限制范围如“过去7天”:ROWS BETWEEN 6 PRECEDING AND CURRENT ROW;掌握该技术可显著提升数据分析能力。

在 SQL 中,SELECT 语句结合窗口函数可以让你在不减少行数的前提下,对数据进行分组、排序和聚合计算。窗口函数不会像 GROUP BY 那样合并行,而是为每一行返回一个计算结果,基于指定的“窗口”范围。
基本语法结构
窗口函数出现在 SELECT 子句中,基本格式如下:
SELECT 列名, 窗口函数(表达式) OVER ( [PARTITION BY 分组列] [ORDER BY 排序列] [ROWS/RANGE 范围定义] ) AS 别名 FROM 表名;PARTITION BY 类似于 GROUP BY,用于将数据分组;ORDER BY 决定窗口内的数据顺序;ROWS/RANGE 可选,用于精确定义窗口的行范围。
常见窗口函数及用法
以下是一些常用的窗口函数及其实际应用场景:
- ROW_NUMBER():为每行分配唯一序号,常用于去重或分页。
- RANK() 和 DENSE_RANK():排名函数,处理并列情况不同。
- SUM() / AVG() / MAX() / MIN():配合 OVER 使用,计算累计或移动平均值。
- LAG() / LEAD():访问当前行之前或之后的数据,适合对比分析。
例如,想查看每个部门员工工资排名:
SELECT name, dept, salary, ROW_NUMBER() OVER (PARTITION BY dept ORDER BY salary DESC) AS rank_in_dept FROM employees;使用场景示例
假设你想计算每位员工在其部门内的工资占比:
SELECT name, dept, salary, ROUND( (salary * 1.0) / SUM(salary) OVER (PARTITION BY dept), 2 ) AS ratio_of_dept FROM employees;这里 SUM(salary) OVER (PARTITION BY dept) 计算每个部门总工资,再与个人工资相除得到比例。
另一个例子:计算每日销售额的累计总额:
SELECT sale_date, amount, SUM(amount) OVER (ORDER BY sale_date) AS cumulated_total FROM sales;注意事项
使用窗口函数时注意以下几点:
- 必须使用 OVER() 子句,否则会变成普通聚合函数。
- 如果没有 PARTITION BY,整个结果集被视为一个窗口。
- ORDER BY 在某些函数中至关重要,比如 ROW_NUMBER 或 LAG,影响结果准确性。
- ROWS BETWEEN 子句可用于限制窗口范围,如“过去 7 天”:
ROWS BETWEEN 6 PRECEDING AND CURRENT ROW
基本上就这些。掌握 SELECT 与窗口函数的结合,能大幅提升数据分析能力。










