0

0

SQL如何计算累计求和趋势图数据_GROUP BY与累加算法实践

P粉602998670

P粉602998670

发布时间:2026-03-19 01:45:28

|

709人浏览过

|

来源于php中文网

原创

MySQL 8.0+ 推荐用窗口函数 SUM() OVER (PARTITION BY ... ORDER BY ...) 实现保序累计求和,须显式指定分区与排序;低版本需用变量模拟但风险高;注意 NULL、重复值、时区及图表补缺等生产细节。

sql如何计算累计求和趋势图数据_group by与累加算法实践

MySQL 8.0+ 用 ROW_NUMBER() 和窗口函数直接累加

累计求和本质是“按某顺序逐行叠加”,不是简单 GROUP BY 能解决的——GROUP BY 是分组聚合,会丢掉行序;而累计求和必须保序。MySQL 8.0+ 支持窗口函数,这是最干净的做法。

常见错误是写成 SUM(value) OVER (ORDER BY date) 却忘了分区:如果数据含多用户、多品类,不加 PARTITION BY user_id 就会跨组累加,结果全乱。

  • 必须显式指定排序字段,比如 ORDER BY created_at,否则结果不可靠
  • 多维度累计(如每个用户每日销售额的累计)要写成 SUM(sales) OVER (PARTITION BY user_id ORDER BY created_at)
  • 注意 NULL 值:若 salesNULLSUM() 会跳过它,但行序不变——这通常符合预期
SELECT
  date,
  sales,
  SUM(sales) OVER (ORDER BY date) AS cum_sales
FROM daily_sales;

低版本 MySQL(5.7 及以下)用变量模拟累加,但要注意初始化时机

变量方案在 5.7 是主流 workaround,但极易出错——核心问题在于 MySQL 不保证 SELECT 中变量赋值的执行顺序,尤其当语句带 ORDER BY 或涉及连接时。

典型错误现象:cum_sales 数值跳跃、重复、归零,甚至不同执行结果不一致。

  • 必须把排序逻辑塞进子查询里,再在外层用变量,不能直接在带 ORDER BY 的主查询中混用变量赋值
  • 变量初始化必须和数据读取在同一 SELECT 中完成,推荐写法:@cum := 0 放在 JOIN(SELECT @cum := 0) AS _ 子句里
  • 避免在 WHERE 或 HAVING 中引用累加变量,MySQL 可能提前剪枝
SELECT
  date,
  sales,
  @cum := @cum + sales AS cum_sales
FROM (
  SELECT date, sales FROM daily_sales ORDER BY date
) t
CROSS JOIN (SELECT @cum := 0) AS _;

PostgreSQL / SQL Server 直接用 SUM() OVER () 更稳,但别漏写 ROWS UNBOUNDED PRECEDING

这些数据库对窗口函数支持更严谨,默认 SUM() OVER (ORDER BY x) 确实等价于累计求和,但显式写上 ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 更安全——它明确告诉优化器“只累加当前行及之前所有行”,避免某些旧版本或复杂嵌套下行为漂移。

Wave.Video
Wave.Video

一个在线的AI自动化视频创作平台

下载

容易踩的坑是误以为 RANGEROWS 一样:当排序字段有重复值(比如多条记录同一天),RANGE 会把同值所有行一起算进当前窗口,导致突增;ROWS 则严格按物理顺序逐行推进。

  • 时间类累计优先用 ROWS,除非你明确需要“同日期全部合并累加”
  • 如果排序字段可能 NULL,记得加 NULLS LASTNULLS FIRST,否则 NULL 行可能被挤到开头或结尾,打乱业务逻辑
SELECT
  date,
  sales,
  SUM(sales) OVER (
    ORDER BY date ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW
  ) AS cum_sales
FROM daily_sales;

生成趋势图数据时,别直接用原始累计值做 Y 轴

前端画趋势图(比如 ECharts 或 Chart.js)要的是「时间点 + 累计值」配对,但真实业务常要求补全缺失日期(比如某天没销售,图上仍需显示前一日累计值),这就不能只靠 SQL 累加。

SQL 累加只负责“已有数据的有序叠加”,补缺、对齐、降采样都得靠应用层或预处理。强行在 SQL 里 LEFT JOIN 日历表再累加,会因空值导致 SUM() 中断,且性能差。

  • 如果图表需展示连续日期,先用程序或日历表生成完整日期序列,再 LEFT JOIN 原始数据,最后用 COALESCE 填充 0,再做窗口累加
  • 高频数据(如每分钟一笔)建议先按小时/天聚合再累加,否则前端渲染卡顿,SQL 扫描量也爆炸
  • 注意时区:数据库时间字段和前端期望的“业务日”可能跨时区,累加前务必统一转换,否则凌晨时段会断层

累计求和本身不难,难的是它总被当成独立问题来解——而实际生产里,它永远嵌在时间对齐、空值处理、权限过滤、分页缓存这一整条链路里。少一个环节,图就画歪了。

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
大数据分析工具有哪四个
大数据分析工具有哪四个

大数据分析的四个工具分别是rapidminer、Hpcc、Hadoop和Pentaho bi。大数据分析用于从各种来源生成的原始数据中提取有价值的数据。这些数据帮助我们获得有意义的见解、隐藏的模式、未知的相关性、市场趋势等等,具体取决于行业。大数据分析的主要动机是提供有价值的见解,以便为未来做出更好的决策。php中文网为大家带来了大数据分析的相关教程、以及相关文章等内容,供大家免费下载使用。

166

2023.06.21

Java 大数据处理基础(Hadoop 方向)
Java 大数据处理基础(Hadoop 方向)

本专题聚焦 Java 在大数据离线处理场景中的核心应用,系统讲解 Hadoop 生态的基本原理、HDFS 文件系统操作、MapReduce 编程模型、作业优化策略以及常见数据处理流程。通过实际示例(如日志分析、批处理任务),帮助学习者掌握使用 Java 构建高效大数据处理程序的完整方法。

786

2025.12.08

大数据专业学习教程
大数据专业学习教程

本专题整合了大数据专业学习相关教程,阅读专题下面的文章了解更多详细内容。

36

2026.01.05

python处理大数据合集
python处理大数据合集

本专题整合了python处理大数据相关教程,阅读专题下面的文章了解更多详细内容。

112

2026.01.05

数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

1135

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

340

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

381

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

2300

2024.03.06

Python WebSocket实时通信与异步服务开发实践
Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践,系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例,帮助开发者构建高效稳定的实时通信系统,适用于聊天应用、实时数据推送等场景。

7

2026.03.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号