sql怎样用GROUPBY对数据进行简单分组 sql分组查询的基础语句用法

絕刀狂花

发布时间：2025-08-15 15:02:01

969人浏览过

来源于php中文网

原创

GROUP BY用于按指定列分组数据，配合聚合函数（如SUM、COUNT、AVG等）对每组数据进行统计；SELECT中非聚合列必须出现在GROUP BY中；多字段分组可实现更细粒度分析；WHERE在分组前过滤行，HAVING在分组后基于聚合结果过滤组。

sql怎样用groupby对数据进行简单分组 sql分组查询的基础语句用法

SQL中的

GROUP BY

子句是用来将具有相同值的数据行归纳为一组，然后对这些组应用聚合函数（如

COUNT

、

SUM

、

AVG

、

MIN

、

MAX

），从而生成汇总信息。简单来说，它能让你把一堆散乱的数据，按照某个或某几个共同的特征“打包”起来，再对每个“包”里的内容进行统计。

解决方案

要使用

GROUP BY

进行数据分组，最基础的语法结构是这样的：你选择一些列来显示，其中至少有一列是用来分组的，同时通常会伴随一个或多个聚合函数。

假设我们有一个

sales_records

表，里面记录了每次销售的

product_category

（产品类别）和

sale_amount

（销售金额）。现在我想知道每个产品类别的总销售额。

SELECT
    product_category,
    SUM(sale_amount) AS total_sales_amount
FROM
    sales_records
GROUP BY
    product_category;

这里，

SELECT product_category, SUM(sale_amount)

表示我想要看到产品类别以及每个类别的销售总额。

FROM sales_records

指定了数据来源。而

GROUP BY product_category

就是关键了，它告诉数据库：把所有

product_category

值相同的行归为一组。比如，所有“电子产品”的销售记录会放在一起，所有“服装”的销售记录放在一起，然后

SUM(sale_amount)

就会计算每个组内的销售总额。

我个人觉得，理解

GROUP BY

的关键在于想象数据是如何被“折叠”起来的。没有

GROUP BY

，

SUM(sale_amount)

会计算整个表的总和；有了它，这个总和就变成了针对每个分组的局部总和。这就像你有一堆不同颜色的珠子，

GROUP BY

就是把同颜色的珠子串成一串，然后你再数每串有多少颗。

GROUP BY

到底能和哪些聚合函数一起用？

说到

GROUP BY

，它几乎总是和聚合函数形影不离。这些函数是它的“好搭档”，因为它们的作用就是对一组数据进行计算，然后返回一个单一的结果。常见的聚合函数有：

COUNT()

：计算组内行的数量。比如

COUNT(*)

会统计组内所有行，

COUNT(column_name)

会统计组内

column_name

非NULL的行数。

-- 统计每个产品类别的销售记录数量
SELECT
    product_category,
    COUNT(*) AS number_of_sales
FROM
    sales_records
GROUP BY
    product_category;

SUM()

：计算组内某列的总和。

-- 统计每个产品类别的总销售额 (上面已经给过例子)

AVG()

：计算组内某列的平均值。

-- 计算每个产品类别的平均销售额
SELECT
    product_category,
    AVG(sale_amount) AS average_sale_amount
FROM
    sales_records
GROUP BY
    product_category;

MIN()

：获取组内某列的最小值。

-- 找出每个产品类别的最低销售额
SELECT
    product_category,
    MIN(sale_amount) AS min_sale_amount
FROM
    sales_records
GROUP BY
    product_category;

MAX()

：获取组内某列的最大值。

-- 找出每个产品类别的最高销售额
SELECT
    product_category,
    MAX(sale_amount) AS max_sale_amount
FROM
    sales_records
GROUP BY
    product_category;

值得注意的是，如果你在

SELECT

语句中包含了一个非聚合列，但又没有把它放到

GROUP BY

子句里，大多数SQL数据库会报错。这是因为数据库不知道该如何为每个分组选择这个非聚合列的值。比如，一个组里可能有好几条销售记录，每条记录的销售日期都不同，如果你只

SELECT product_category, sale_date

而

GROUP BY product_category

，数据库就懵了，它不知道该显示哪个

sale_date

。所以，记住这个原则：

SELECT

列表中除了聚合函数之外的任何列，都必须出现在

GROUP BY

子句中。

多个字段如何一起分组？

有时候，我们不仅仅想按一个维度来分组，而是希望从更细致的角度去分析数据。比如，我想知道每个产品类别在不同销售区域（

sales_region

）的销售情况。这时候，就可以使用多个字段进行分组。

SELECT
    product_category,
    sales_region,
    SUM(sale_amount) AS total_sales_amount
FROM
    sales_records
GROUP BY
    product_category,
    sales_region;

这个查询会创建更细粒度的分组。它会把“电子产品”在“北方区域”的销售记录归为一组，“电子产品”在“南方区域”的销售记录归为另一组，以此类推。每个

product_category

和

sales_region

的独特组合都会形成一个独立的分组。

Napkin AI

Napkin AI 可以将您的文本转换为图表、流程图、信息图、思维导图视觉效果，以便快速有效地分享您的想法。

下载

我发现，多字段分组在做数据透视时特别有用。它能一下子把数据的层级感拉出来，从宏观到微观，洞察力瞬间提升。比如，你可能发现某个产品类别在整体上表现不错，但一细分到区域，就发现它在某个特定区域的销售额异常低，这就能帮你快速定位问题。这种分层分析的能力，是

GROUP BY

真正的魅力所在。

HAVING

和

WHERE

在分组查询中有什么区别？

这是

GROUP BY

查询中一个非常常见且容易混淆的点：什么时候用

WHERE

，什么时候用

HAVING

？简单来说，它们都是用来过滤数据的，但过滤的时机和对象不同。

WHERE

子句：在数据被分组之前进行过滤。它作用于原始的、未聚合的行数据。如果你想排除某些行，让它们甚至不参与分组和聚合计算，那就用

WHERE

。

-- 只统计销售额大于100的产品记录，然后再按产品类别分组
SELECT
    product_category,
    SUM(sale_amount) AS total_sales_amount
FROM
    sales_records
WHERE
    sale_amount > 100 -- 过滤掉单笔销售额小于等于100的记录
GROUP BY
    product_category;

在这个例子中，

WHERE sale_amount > 100

会先筛选出所有单笔销售额超过100的记录，然后这些被筛选过的记录才会被

GROUP BY product_category

进行分组和聚合。

HAVING

子句：在数据被分组之后进行过滤。它作用于已经聚合过的组数据。如果你想基于聚合函数的结果来过滤分组，那就用

HAVING

。

-- 统计每个产品类别的总销售额，但只显示总销售额超过5000的类别
SELECT
    product_category,
    SUM(sale_amount) AS total_sales_amount
FROM
    sales_records
GROUP BY
    product_category
HAVING
    SUM(sale_amount) > 5000; -- 过滤掉总销售额小于等于5000的类别

这里，