0

0

SQL数据分桶统计怎么做_区间统计实现方案解析【教学】

舞夢輝影

舞夢輝影

发布时间:2025-12-18 19:53:02

|

443人浏览过

|

来源于php中文网

原创

SQL数据分桶统计本质是将连续数值按预设区间归类计数,核心通过CASE WHEN(适合不规则区间)、FLOOR/CEILING(适合等宽分桶)或WIDTH_BUCKET函数(Oracle/PG专属)实现分组逻辑,再配合GROUP BY和COUNT完成统计。

sql数据分桶统计怎么做_区间统计实现方案解析【教学】

SQL数据分桶统计,本质是把连续数值按预设区间(桶)归类后计数,核心靠 CASE WHENFLOOR/CEILING + 运算 实现分组逻辑,再配合 GROUP BYCOUNT 完成统计。

用 CASE WHEN 明确划分区间(推荐新手)

适合区间不规则、有业务含义或需要自定义标签的场景。比如统计用户年龄分布:
0–17为“未成年”,18–35为“青年”,36–59为“中年”,60+为“老年”。

  • 每个区间写一个 WHEN 条件,注意边界是否包含(用 >= / > /
  • ELSE 不可少,兜底异常值(如年龄为负、超200等),避免漏统计
  • 别在 SELECT 中直接写 COUNT(*),而应先生成“桶列”,再 GROUP BY 该列

示例:

SELECT
  CASE
    WHEN age BETWEEN 0 AND 17 THEN '未成年'
    WHEN age BETWEEN 18 AND 35 THEN '青年'
    WHEN age BETWEEN 36 AND 59 THEN '中年'
    WHEN age >= 60 THEN '老年'
    ELSE '未知'
  END AS age_group,
  COUNT(*) AS cnt
FROM users
GROUP BY age_group;

用 FLOOR 或 CEILING 做等宽分桶(适合数值型连续字段)

当区间等距(如每10岁一桶、每100元一档),用数学函数更简洁、易扩展。关键在构造“桶编号”:用原始值做除法再取整,即可映射到整数桶号。

eSiteGroup站群管理系统1.0.4
eSiteGroup站群管理系统1.0.4

eSiteGroup站群管理系统是基于eFramework低代码开发平台构建,是一款高度灵活、可扩展的智能化站群管理解决方案,全面支持SQL Server、SQLite、MySQL、Oracle等主流数据库,适配企业级高并发、轻量级本地化、云端分布式等多种部署场景。通过可视化建模与模块化设计,系统可实现多站点的快速搭建、跨平台协同管理及数据智能分析,满足政府、企业、教育机构等组织对多站点统一管控的

下载
  • 正数用 FLOOR(value / width),例如 FLOOR(score / 10) 把 0–9→0,10–19→1…
  • 若想让 1–10、11–20…这样分,可用 FLOOR((value - 1) / width) + 1
  • 负数需额外处理(如先加偏移量转为正数),否则 FLOOR(-1.5) = -2,易出错

示例(成绩0–100,每20分一桶):

SELECT
  FLOOR(score / 20) AS bucket_id,
  CONCAT(FLOOR(score / 20) * 20, '-', FLOOR(score / 20) * 20 + 19) AS score_range,
  COUNT(*) AS cnt
FROM exams
WHERE score IS NOT NULL
GROUP BY bucket_id
ORDER BY bucket_id;

用 WIDTH_BUCKET(Oracle/PostgreSQL专属函数)

Oracle 和 PostgreSQL 提供原生分桶函数,一行搞定等宽分桶,自动处理边界和越界情况。

  • 语法:WIDTH_BUCKET(value, min_val, max_val, num_buckets),返回 1 到 num_buckets+2 的整数
  • 返回值含义:1=小于min,num_buckets+2=大于max,中间1~num_buckets才是正常区间
  • 无需手动写边界条件,但需确保 min/max 覆盖全量数据,否则会进“越界桶”

示例(将 salary 分为4等宽桶):

SELECT
  WIDTH_BUCKET(salary, 3000, 20000, 4) AS bucket,
  COUNT(*)
FROM employees
GROUP BY bucket
ORDER BY bucket;

注意事项与避坑点

  • NULL 值默认不参与任何分桶,务必用 WHERE 过滤或在 CASE 中显式处理
  • 字符串型数值(如 '123')不能直接运算,需先 CAST 或 +0 转类型
  • 分桶结果建议加上范围描述列(如 CONCAT),比纯数字桶号更直观
  • 大数据量时,对分桶字段建索引无效(因含函数或表达式),优化重点在原始字段和 WHERE 条件

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

685

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

323

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

348

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1117

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

359

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

717

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

577

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

419

2024.04.29

C++ 高级模板编程与元编程
C++ 高级模板编程与元编程

本专题深入讲解 C++ 中的高级模板编程与元编程技术,涵盖模板特化、SFINAE、模板递归、类型萃取、编译时常量与计算、C++17 的折叠表达式与变长模板参数等。通过多个实际示例,帮助开发者掌握 如何利用 C++ 模板机制编写高效、可扩展的通用代码,并提升代码的灵活性与性能。

9

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
SQL 教程
SQL 教程

共61课时 | 3.5万人学习

Java 教程
Java 教程

共578课时 | 49.9万人学习

oracle知识库
oracle知识库

共0课时 | 0人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号