count、sum、avg 是sql基础聚合函数,需配合group by使用且自动忽略null;count(*)统计所有行,count(列)统计非null行,count(distinct 列)去重计数;sum仅适用于数值列,跳过null;avg等于sum(列)/count(列),受异常值影响大,需谨慎使用。

COUNT、SUM、AVG 是 SQL 中最常用的基础聚合函数,分别用于计数、求和与计算平均值。它们必须配合 GROUP BY 使用(除非全表聚合),且会自动忽略 NULL 值——这是理解结果偏差的关键。
什么时候用 COUNT?注意 COUNT(*) 和 COUNT(列) 的区别
COUNT 用来统计行数,但写法不同,语义完全不同:
- COUNT(*):统计所有行,包括含 NULL 的行,也包含重复行。适合“这张表一共有多少条记录”这类需求。
-
COUNT(列名):只统计该列非 NULL 的值的行数。比如
COUNT(email)表示“有多少用户填了邮箱”。 -
COUNT(DISTINCT 列名):统计该列去重后的非 NULL 值数量。例如
COUNT(DISTINCT user_id)可查有多少独立用户下单过。
SUM 适用场景:只对数值列有意义,且需警惕 NULL 和类型隐式转换
SUM 用于累加数值型字段,常见于订单金额、库存数量、积分等场景:
- 若列中存在 NULL,SUM 会跳过它,不会报错也不会转为 0;但如果整列都是 NULL,结果返回 NULL。
- 别对字符串或日期直接 SUM——即使数据库没报错(如 MySQL 允许字符串转数字),也可能导致意外结果。例如
SUM('123abc')在某些模式下变成 123,但SUM('abc123')变成 0。 - 建议显式过滤异常值:
SUM(CASE WHEN amount > 0 THEN amount ELSE 0 END),避免负数干扰业务逻辑。
AVG 要小心分母为零、NULL 和数据分布偏斜
AVG 实质是 SUM(列)/COUNT(列),所以它天然继承了前两者的特性:
- AVG(列) = SUM(列) / COUNT(列),不是 SUM(列) / COUNT(*)。这意味着它只基于非 NULL 值计算,分母永远不会是 0(空集时返回 NULL)。
- 当数据存在极端值(如一个订单 100 万元,其余都在 100 元以内),AVG 会被拉高,失真明显。此时可搭配
MEDIAN()(部分数据库支持)或用分位数替代。 - 需要“带权平均”时不能直接用 AVG,得手写:
SUM(单价 * 数量) / SUM(数量)。
组合使用小技巧:HAVING 筛选分组结果,COALESCE 处理空值
聚合后常需进一步过滤或美化输出:
- 用
HAVING替代WHERE对聚合结果筛选。例如查“平均订单额超 500 的城市”:GROUP BY city HAVING AVG(order_amount) > 500。 - 聚合结果可能为 NULL(如某类商品无销售记录),用
COALESCE(AVG(rating), 0)统一转成 0,避免前端报错或展示为空。 - 想同时看总数、总金额、平均单笔金额?一行搞定:
SELECT COUNT(*), SUM(amount), AVG(amount) FROM orders WHERE status = 'paid'。










