WHERE中不能用CASE WHEN做动态分组,因WHERE执行时聚合尚未发生;正确做法是GROUP BY后使用CASE WHEN,或SELECT中配合聚合函数使用CASE WHEN。

WHERE里不能直接用CASE WHEN做动态分组边界
很多人一上来就想在 WHERE 子句里写 CASE WHEN score > 90 THEN 'A'... 来过滤分组,结果报错或逻辑错乱。因为 WHERE 执行时聚合还没发生,CASE 引用的字段若来自聚合(比如 AVG(price))或需要按组计算的值,根本不可见。
真正能承载“动态区间分组”的地方只有两个:一是 GROUP BY 后的表达式,二是 SELECT 中配合聚合函数使用的 CASE WHEN —— 它不参与分组,但能按条件归类统计结果。
- 分组动作必须在聚合前完成,所以动态区间的定义得塞进
GROUP BY或作为衍生列提前算好 - 如果区间依赖全表统计值(比如“高于平均值的算高分组”),就得用子查询或窗口函数先算出基准,再关联或嵌套
- 别在
HAVING里试图用CASE定义新分组——它只能过滤已形成的组,不能重构分组逻辑
GROUP BY + CASE WHEN 是最常用且安全的动态分组写法
这是多数场景下的首选,语义清晰、兼容性好(MySQL 5.7+、PostgreSQL、SQL Server、Oracle 都支持),而且不会引发执行计划异常。
例如按订单金额划分为「小额」「中额」「大额」三档并统计单数:
SELECT
CASE
WHEN amount < 100 THEN '小额'
WHEN amount BETWEEN 100 AND 999 THEN '中额'
ELSE '大额'
END AS amount_level,
COUNT(*) AS order_count
FROM orders
GROUP BY
CASE
WHEN amount < 100 THEN '小额'
WHEN amount BETWEEN 100 AND 999 THEN '中额'
ELSE '大额'
END;
-
GROUP BY里的CASE WHEN必须和SELECT中的完全一致(包括空格、大小写),否则某些数据库(如 MySQL 严格模式)会报错 - 别省略
ELSE—— 空值或未覆盖的值会导致整行被排除出分组,数据对不上时第一个就查这个 - 区间判断顺序很重要:
BETWEEN和混用时注意边界重叠或遗漏,建议从小到大写,用 <code> + <code> 显式控制
需要跨组参考全局值?得用子查询或窗口函数预计算
比如“把销量高于全店平均值的 SKU 归为畅销组”,这时分组依据不是单行字段,而是全表聚合结果。直接在 GROUP BY 里写 AVG(sales) 会报错 —— 聚合函数不能出现在 GROUP BY 中。
解法是先算出平均值,再 join 或用窗口函数带入:
SELECT CASE WHEN sales > avg_sales THEN '畅销' ELSE '常规' END AS group_type, COUNT(*) AS sku_count FROM ( SELECT sales, AVG(sales) OVER() AS avg_sales FROM products ) t GROUP BY CASE WHEN sales > avg_sales THEN '畅销' ELSE '常规' END;
- 用
AVG() OVER()比子查询更简洁,且避免了关联开销;但老版本 MySQL(CROSS JOIN 或JOIN - 如果平均值要按类目算(比如“高于本类目平均值”),就把
OVER(PARTITION BY category)补上,别漏掉分区键 - 注意浮点精度:
AVG可能返回小数,跟整型字段比较时,某些数据库会隐式转换失败,建议显式转类型或用ROUND
嵌套聚合 + CASE WHEN 容易触发“invalid use of group function”错误
典型错误写法:SELECT COUNT(CASE WHEN SUM(price) > 1000 THEN 1 END) FROM orders GROUP BY user_id —— 这里 SUM(price) 是聚合函数,又出现在另一个聚合 COUNT 的参数里,MySQL 直接拒绝,PostgreSQL 也会报错。
本质是层级混乱:内层聚合(SUM)作用域是 GROUP BY user_id 后的每组,外层 COUNT 却想跨组计数,SQL 不允许这种嵌套。
- 正确做法是拆成两层:先用子查询算出每组的
SUM(price),再在外层对结果集做CASE WHEN统计 - 如果只是想标记“某用户总消费是否超 1000”,直接在
SELECT里写CASE WHEN SUM(price) > 1000 THEN 1 ELSE 0 END就行,不需要再套一层COUNT - 真要统计“有多少用户的总消费超 1000”,就用
SUM(CASE WHEN SUM(price) > 1000 THEN 1 ELSE 0 END)—— 但注意这是 MySQL 5.7+ 允许的特例,其他数据库可能不认,稳妥起见还是子查询
GROUP BY CASE,后者必须拆层,绕不开。










