count() over(partition by ...) 是一种 sql 窗口函数,用于在不合并行的前提下按指定字段分组统计行数。它保留原始数据每一行,并在每行显示所属分组的计数值,相比 group by 更灵活,适合带明细的统计场景。1. 常用于统计每个类别或人员的数量,如每个部门的员工人数;2. 可结合 order by 实现累计统计,如计算截止某日的订单总数;3. 支持在 where 过滤后进行计数,如统计用户最近一个月登录次数。使用时需注意 count(字段) 会忽略 null 值,count(*) 则统计所有行,partition by 可跟多个字段,且需关注大数据量下的性能问题。

在 SQL 查询中,COUNT() OVER(PARTITION BY ...) 是一种窗口函数的用法,它能让你在不改变原始数据行的前提下,对数据进行分组统计。相比传统的 GROUP BY,它更灵活,尤其适合做带明细的统计。

什么是 COUNT() OVER(PARTITION BY ...)
简单来说,它是把数据按照某个字段(或多个字段)分区,然后在每个分区内独立计算行数。结果会保留每一行的数据,并在每行上加上该分区内的计数值。
举个例子:你有一张销售记录表,里面有销售人员和订单信息。你想知道每位销售员有多少条订单记录,但又不想合并行,这时候就可以用这个方法。

语法如下:
COUNT(字段名) OVER(PARTITION BY 分组字段)
比如:

SELECT name, order_id,
COUNT(order_id) OVER(PARTITION BY name) AS total_orders
FROM sales;这样就能看到每个人的订单数量,同时保留每一条订单记录。
常见使用场景
1. 统计每个人或每类别的记录数量
这是最常见的一种用途。例如统计每个部门员工数量,但又想保留所有员工的信息。
SELECT employee_id, department,
COUNT(employee_id) OVER(PARTITION BY department) AS dept_count
FROM employees;这样每行都会显示所属部门的总人数。
2. 结合排序做累计统计
除了单纯计数,还可以配合 ORDER BY 和 ROWS BETWEEN 实现动态累计值。
比如查看某销售每天的订单量并计算截止当天的总订单数:
SELECT name, order_date,
COUNT(order_id) OVER(PARTITION BY name ORDER BY order_date) AS cum_orders
FROM sales;这在分析趋势时很有用。
3. 配合 WHERE 条件过滤后计数
有时候我们只关心满足特定条件的数据计数,可以在主查询中加 WHERE 过滤后再使用 OVER(PARTITION BY...)。
例如:统计每位用户最近一个月内的登录次数:
SELECT user_id, login_time,
COUNT(login_time) OVER(PARTITION BY user_id) AS recent_logins
FROM logins
WHERE login_time >= DATE_SUB(CURRENT_DATE, INTERVAL 1 MONTH);使用时需要注意的地方
COUNT 的字段是否为 NULL
如果你写的是COUNT(*),那会统计所有行;如果是COUNT(字段),则只会统计该字段非空的行。-
PARTITION BY 后面可以跟多个字段
比如按地区和地区类型一起分区:COUNT(*) OVER(PARTITION BY region, region_type)
性能问题要注意
尤其是在大数据量下,窗口函数可能会比较慢,建议合理使用索引和分区。
总结
COUNT() OVER(PARTITION BY ...) 是一个非常实用的 SQL 技巧,尤其适合需要保留明细的同时做分组统计的场景。掌握它的基本用法和几个关键细节,能大大提升你的数据分析效率。
基本上就这些了,用多了你会发现它比 GROUP BY 更灵活,也更适合复杂报表场景。










