0

0

SQL 查询中的条件聚合与总计计算

聖光之護

聖光之護

发布时间:2025-10-04 16:49:01

|

274人浏览过

|

来源于php中文网

原创

SQL 查询中的条件聚合与总计计算

本文详细阐述了如何在SQL查询中高效地进行数据聚合,特别是在需要同时计算总数和基于特定条件的子集总数(如未请假次数)时。通过一个实际案例,文章演示了如何利用SUM()函数结合0/1标志列来实现条件计数,从而扩展现有查询以获取更丰富的数据洞察。教程强调了GROUP BY子句的重要性,并提供了清晰的SQL代码示例,旨在帮助读者优化其数据分析查询。

在数据分析和报表生成中,我们经常需要从数据库中提取聚合信息,例如某个类别的总数、最大值或最小值。更进一步,有时还需要在这些总数的基础上,计算满足特定条件的子集数量。本教程将通过一个具体场景,演示如何在sql查询中同时实现总数统计和条件计数。

场景描述

假设我们有一个员工考勤系统,其中包含employees表和callouts(出勤记录)表。employees表存储员工信息,callouts表记录了员工的每一次出勤或缺勤。callouts表中有一个EXCUSED列,用0表示请假(excused),1表示未请假(unexcused)。我们的目标是查询每个司机的总出勤/缺勤次数,并在此基础上,额外统计他们的未请假次数。

初始查询与结果分析

首先,我们有一个基础查询,用于统计每个司机的总出勤/缺勤次数以及最近一次记录的日期:

SELECT
    e.driver,
    c.id, -- 注意:这里c.id在GROUP BY中可能不是预期的,通常我们会选择聚合函数如MAX(c.id)或移除
    MAX(c.date) AS latest_date,
    COUNT(*) AS total_instances
FROM
    employees AS e
JOIN
    callouts AS c ON e.id = c.id
WHERE
    e.status = 0 -- 假设status = 0表示在职员工
GROUP BY
    e.driver
ORDER BY
    e.driver;

这个查询通过employees和callouts表进行连接,筛选出状态为0的员工,然后按driver分组,计算每个司机的总记录数 (COUNT(*)) 和最近的记录日期 (MAX(c.date))。c.id列在这里直接选择,但由于GROUP BY e.driver,c.id的值将是不确定的(取决于数据库的实现,可能会是该组中的任意一个c.id),在实际应用中,通常会对其应用聚合函数(如MIN(c.id)或MAX(c.id))或者如果不是聚合键则不直接选择。

假设上述查询的结果如下:

DRIVER ID LATEST_DATE TOTAL_INSTANCES
BILL 2 2021-11-09 9
FRED 8 2021-11-01 6
TOM 4 2021-11-03 3

引入条件计数:统计未请假次数

现在,我们需要在此基础上增加一列,显示每个司机的未请假次数。callouts表中的EXCUSED列是一个关键,1代表未请假,0代表请假。

由于EXCUSED列的值是0或1,我们可以巧妙地利用SUM()聚合函数来实现条件计数。当对一个包含0和1的列求和时,其结果就是1的出现次数。因此,SUM(c.excused)将直接给出未请假(EXCUSED = 1)的总次数。

优化后的查询

将这个条件计数逻辑整合到原有的查询中,得到以下优化后的SQL:

塑料卡板销售统计管理系统
塑料卡板销售统计管理系统

塑料卡板销售统计管理系统是一款对商品销售情况进行统一管理的系统。 程序特点1,简单,方便,网络操作,不受单台电脑文件保存限制2,纸质与数据库客户数据保存,查询变得更为方便3,免去久远的历史单据与数据查询烦恼4,方便的数据统计与自动核算功能5,丰富的销售数据录入与管理6, 销售清单(送货单)打印功能,支持条型码.7, 销售业绩提成统计功能8, 收款与未收款分开统计功能 后台地址:admin/logi

下载
SELECT
    e.driver,
    MAX(c.id) AS example_callout_id, -- 修正c.id的用法,使用聚合函数
    MAX(c.date) AS latest_date,
    COUNT(*) AS total_instances,
    SUM(c.excused) AS unexcused_absences -- 新增:计算未请假次数
FROM
    employees AS e
JOIN
    callouts AS c ON e.id = c.id
WHERE
    e.status = 0
GROUP BY
    e.driver
ORDER BY
    e.driver;

在这个修改后的查询中:

  • 我们保留了原有的e.driver、MAX(c.date)和COUNT(*)来获取每个司机的基本聚合信息。
  • MAX(c.id)被用来替代之前不明确的c.id选择,确保了在GROUP BY上下文中的正确性。
  • 最重要的是,SUM(c.excused) AS unexcused_absences这一行,它直接计算了每个司机所有记录中EXCUSED值为1的次数,从而得到了未请假的总数。

预期结果

执行上述查询后,结果将包含新增的unexcused_absences列:

DRIVER EXAMPLE_CALLOUT_ID LATEST_DATE TOTAL_INSTANCES UNEXCUSED_ABSENCES
BILL 2 2021-11-09 9 5
FRED 8 2021-11-01 6 3
TOM 4 2021-11-03 3 1

(注:UNEXCUSED_ABSENCES列的值是示例数据,实际值将根据数据库中的EXCUSED列数据计算得出。)

注意事项与通用性

  1. 数据类型: SUM()函数用于条件计数时,要求条件列(如EXCUSED)必须是数值类型,且能够表示0和1(或TRUE/FALSE,某些数据库会自动转换为1/0)。这种0/1标志列是实现此方法的理想场景。
  2. 更通用的条件计数: 如果条件列不是简单的0/1标志,或者需要基于更复杂的逻辑进行计数,可以使用COUNT(CASE WHEN condition THEN 1 END)或SUM(CASE WHEN condition THEN 1 ELSE 0 END)。例如,如果EXCUSED列存储的是文本'YES'或'NO':
    SUM(CASE WHEN c.excused = 'NO' THEN 1 ELSE 0 END) AS unexcused_absences

    这种CASE表达式的方法更为通用,适用于各种复杂的条件判断。

  3. 性能考虑: 在大型数据集上,聚合函数会消耗一定的计算资源。确保表上有适当的索引,特别是employees.id、callouts.id和employees.status等用于连接和筛选的列,可以显著提高查询性能。
  4. GROUP BY的重要性: 所有的非聚合列都必须出现在GROUP BY子句中,或者被聚合函数包裹。这是SQL聚合查询的基本原则。

总结

通过本教程,我们学习了如何在SQL查询中结合GROUP BY子句,利用SUM()函数对0/1标志列进行条件计数,从而在一次查询中同时获取总数和满足特定条件的子集数量。这种技术在数据分析和报表生成中非常实用,能够帮助我们更高效地从原始数据中提取有价值的信息。理解并灵活运用SUM()与CASE表达式进行条件聚合,是SQL数据处理中一项重要的技能。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

685

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

323

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

348

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1117

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

359

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

717

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

577

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

419

2024.04.29

c++空格相关教程合集
c++空格相关教程合集

本专题整合了c++空格相关教程,阅读专题下面的文章了解更多详细内容。

0

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 13.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.2万人学习

NumPy 教程
NumPy 教程

共44课时 | 3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号