SQL中如何分组数据_SQL分组查询的GROUPBY详解

蓮花仙者

发布时间：2025-10-02 17:15:02

1055人浏览过

来源于php中文网

原创

SQL中分组数据通过GROUP BY实现，先按指定列分组再对每组应用COUNT、SUM等聚合函数；SELECT需包含分组列和聚合结果，WHERE用于分组前过滤，HAVING对分组后结果过滤且可含聚合条件，ORDER BY可结合别名或表达式进行排序，NULL值在分组时被视为单独一组，可用COALESCE或CASE处理。

sql中如何分组数据_sql分组查询的groupby详解

SQL中的分组数据主要通过GROUP BY语句实现，它允许你将数据按照一个或多个列的值进行分组，然后对每个分组应用聚合函数，如COUNT、SUM、AVG、MAX和MIN。

GROUP BY的核心在于“分组”和“聚合”。先将数据按照指定的列进行分组，然后对每个组的数据进行汇总计算。

解决方案

GROUP BY语句的基本语法如下：

SELECT column1, column2, ..., aggregate_function(columnX)
FROM table_name
WHERE condition
GROUP BY column1, column2, ...
ORDER BY column1, column2, ...;

SELECT：指定要选择的列，包括分组列和聚合函数的结果。
FROM：指定要查询的表。
WHERE：可选，指定过滤条件。
GROUP BY：指定用于分组的列。
ORDER BY：可选，指定结果的排序方式。

示例：

假设有一个orders表，包含以下列：order_id、customer_id、order_date、amount。

1. 统计每个客户的订单总数：

SELECT customer_id, COUNT(*) AS total_orders
FROM orders
GROUP BY customer_id;

这个查询会按照customer_id进行分组，然后计算每个客户的订单数量。COUNT(*)会计算每个分组中的行数，即订单数量。

2. 统计每个客户的订单总金额：

SELECT customer_id, SUM(amount) AS total_amount
FROM orders
GROUP BY customer_id;

这个查询会按照customer_id进行分组，然后计算每个客户的订单总金额。SUM(amount)会计算每个分组中amount列的总和。

3. 统计每个客户的平均订单金额，并且只显示平均金额大于100的客户：

SELECT customer_id, AVG(amount) AS average_amount
FROM orders
GROUP BY customer_id
HAVING AVG(amount) > 100;

这里使用了HAVING子句，它类似于WHERE子句，但是用于过滤分组后的结果。HAVING子句必须在GROUP BY子句之后。

一些注意事项：

SELECT列表中未在GROUP BY子句中出现的列，必须使用聚合函数。否则，SQL会报错。
WHERE子句用于过滤分组前的行，而HAVING子句用于过滤分组后的结果。
GROUP BY子句可以包含多个列，按照这些列的组合进行分组。

GROUP BY是SQL中非常强大的工具，可以用于各种数据分析和报表生成。

GROUP BY后如何使用HAVING子句进行更精细的过滤？

HAVING子句允许你对GROUP BY分组后的结果进行过滤。它与WHERE子句类似，但WHERE用于过滤单个行，而HAVING用于过滤整个分组。

语法：

SELECT column1, column2, ..., aggregate_function(columnX)
FROM table_name
WHERE condition
GROUP BY column1, column2, ...
HAVING condition;
ORDER BY column1, column2, ...;

HAVING子句中的condition可以使用聚合函数，例如COUNT()、SUM()、AVG()、MAX()和MIN()。

示例：

假设我们有一个sales表，包含product_id、sales_date、quantity和price列。我们想要找出销售数量大于100的产品的平均价格。

SELECT product_id, AVG(price) AS average_price
FROM sales
GROUP BY product_id
HAVING SUM(quantity) > 100;

这个查询首先按照product_id进行分组，然后计算每个产品的平均价格。HAVING SUM(quantity) > 100会过滤掉销售数量小于等于100的产品，只显示销售数量大于100的产品的平均价格。

WHERE vs HAVING：

WHERE在GROUP BY之前应用，用于过滤单个行。
HAVING在GROUP BY之后应用，用于过滤分组后的结果。

何时使用HAVING？

当你需要基于聚合函数的结果进行过滤时，必须使用HAVING。
如果你只需要基于单个行的值进行过滤，可以使用WHERE。

例如，如果你想找出所有价格大于10的产品，可以使用WHERE price > 10。但是，如果你想找出平均价格大于10的产品，则必须使用HAVING AVG(price) > 10。

GROUP BY与ORDER BY的结合使用有哪些技巧？

GROUP BY用于分组数据，而ORDER BY用于排序结果。将它们结合使用可以生成更有意义的报表和分析结果。

基本用法：

SELECT column1, column2, ..., aggregate_function(columnX)
FROM table_name
WHERE condition
GROUP BY column1, column2, ...
ORDER BY columnY [ASC | DESC];

ORDER BY子句可以按照分组列或聚合函数的结果进行排序。ASC表示升序（默认），DESC表示降序。

示例：

假设我们有一个employees表，包含department_id、employee_id和salary列。我们想要统计每个部门的平均工资，并按照平均工资从高到低排序。

PathFinder

AI驱动的销售漏斗分析工具

下载

SELECT department_id, AVG(salary) AS average_salary
FROM employees
GROUP BY department_id
ORDER BY average_salary DESC;

这个查询首先按照department_id进行分组，然后计算每个部门的平均工资。ORDER BY average_salary DESC会按照平均工资从高到低排序结果。

高级技巧：

按照多个列排序：

ORDER BY子句可以包含多个列，按照这些列的顺序进行排序。例如，我们可以先按照部门ID排序，然后在每个部门内按照平均工资排序。
```
SELECT department_id, AVG(salary) AS average_salary
FROM employees
GROUP BY department_id
ORDER BY department_id ASC, average_salary DESC;
```

使用别名排序：

ORDER BY子句可以使用SELECT列表中定义的别名进行排序。

SELECT department_id, AVG(salary) AS average_salary
FROM employees
GROUP BY department_id
ORDER BY average_salary DESC; -- 使用别名average_salary

使用表达式排序：

ORDER BY子句可以使用表达式进行排序。例如，我们可以按照平均工资的平方排序。
```
SELECT department_id, AVG(salary) AS average_salary
FROM employees
GROUP BY department_id
ORDER BY AVG(salary) * AVG(salary) DESC;
```

结合LIMIT子句：

LIMIT子句可以限制结果的数量。例如，我们可以只显示平均工资最高的三个部门。

SELECT department_id, AVG(salary) AS average_salary
FROM employees
GROUP BY department_id
ORDER BY average_salary DESC
LIMIT 3;

GROUP BY和ORDER BY的结合使用可以帮助你更有效地分析和呈现数据。

GROUP BY语句在处理NULL值时有哪些需要注意的地方？

在SQL中，NULL表示缺失或未知的值。GROUP BY语句在处理NULL值时，会将所有NULL值视为一个单独的分组。

行为：

GROUP BY会将所有NULL值放在同一个分组中。
如果分组列包含NULL值，则结果集中会包含一个NULL值的分组。
聚合函数（如COUNT()、SUM()、AVG()、MAX()和MIN()）在计算时会忽略NULL值，但COUNT(*)会计算包含NULL值的行。

示例：

假设我们有一个customers表，包含customer_id和city列。city列可能包含NULL值。

SELECT city, COUNT(*) AS customer_count
FROM customers
GROUP BY city;

这个查询会按照city进行分组，然后计算每个城市的客户数量。如果city列包含NULL值，则结果集中会包含一个NULL值的分组，表示没有城市信息的客户数量。

处理NULL值的技巧：

使用COALESCE()函数：

COALESCE()函数可以用于将NULL值替换为其他值。例如，我们可以将NULL值替换为'Unknown'。
```
SELECT COALESCE(city, 'Unknown') AS city, COUNT(*) AS customer_count
FROM customers
GROUP BY COALESCE(city, 'Unknown');
```
这个查询会将所有NULL值替换为'Unknown'，然后按照city进行分组。
使用WHERE子句排除NULL值：

如果你不想包含NULL值的分组，可以使用WHERE子句排除NULL值。
```
SELECT city, COUNT(*) AS customer_count
FROM customers
WHERE city IS NOT NULL
GROUP BY city;
```
这个查询会排除city列为NULL的行，只计算有城市信息的客户数量。
使用CASE表达式：

CASE表达式可以用于根据条件进行不同的处理。例如，我们可以根据city是否为NULL来显示不同的值。
```
SELECT
    CASE
        WHEN city IS NULL THEN 'Unknown'
        ELSE city
    END AS city,
    COUNT(*) AS customer_count
FROM customers
GROUP BY
    CASE
        WHEN city IS NULL THEN 'Unknown'
        ELSE city
    END;
```
这个查询使用CASE表达式将NULL值替换为'Unknown'，然后按照city进行分组。