SQL 分组统计与排名分析优化

冷漠man

发布时间：2026-02-14 20:00:12

519人浏览过

来源于php中文网

原创

group by后加排名应避免直接在分组结果上用窗口函数，而应先物化小结果集再开窗；top n优先用lateral或join+limit；mysql 5.7慎用row_number()；count(distinct)和group_concat需索引与长度调优；取最新记录推荐row_number()配合唯一性补排序；order by能否用索引取决于是否严格匹配分组列或聚合结果。

sql 分组统计与排名分析优化

GROUP BY 后怎么加排名不拖慢查询

直接用 ROW_NUMBER() 或 RANK() 套在 GROUP BY 结果上，90% 情况下会触发临时表 + 文件排序，尤其数据量过百万时，响应从毫秒级跳到秒级。根本原因不是函数本身慢，而是窗口函数执行时机晚于分组——它是在 GROUP BY 产出结果集之后才计算的，没复用分组索引。

实操建议：

先用子查询或 CTE 把分组结果物化成带主键/索引的小结果集（比如按 category_id 分组后只有几百行），再对这个小结果集开窗，避免全表扫+大排序
如果只是要「每个分组内 Top N」，优先用 LATERAL（PostgreSQL）或 JOIN + LIMIT 子查询（MySQL 8.0+ 支持相关子查询优化），比窗口函数快一个数量级
MySQL 5.7 及更早版本慎用 ROW_NUMBER()：它底层靠变量模拟，遇到并发查询或优化器重排执行顺序时容易错序，必须加 ORDER BY 强制稳定排序，且不能依赖执行计划

COUNT(DISTINCT) 和 GROUP_CONCAT 在大表里为什么卡死

COUNT(DISTINCT) 在没有合适索引时，会强制走全表扫描并构建哈希表；GROUP_CONCAT 则默认受 group_concat_max_len 限制（通常 1024），超长截断还不报错，查出来数据莫名其妙变短。

实操建议：

COUNT(DISTINCT user_id) 这类统计，如果 user_id 上没索引，就别硬扛——先建联合索引 (category_id, user_id)（假设按 category 分组），让索引覆盖查询，避免回表
MySQL 中调大 group_concat_max_len 要设会话级变量：SET SESSION group_concat_max_len = 1000000;，全局设置需重启，不推荐
PostgreSQL 用 STRING_AGG(col, ',') 替代 GROUP_CONCAT，无长度隐式截断，但要注意内存占用，大数据量聚合时加 ORDER BY 会让性能明显下降

分组后取最新一条记录的三种写法，哪一种不翻车

常见需求：每个 product_id 下取 created_at 最大的那条订单。用 MAX(created_at) 配合 JOIN、用子查询、用窗口函数，三种写法在 NULL、重复时间戳、多列返回场景下表现差异极大。

magento(麦进斗)

Magento是一套专业开源的PHP电子商务系统。Magento设计得非常灵活，具有模块化架构体系和丰富的功能。易于与第三方应用系统无缝集成。Magento开源网店系统的特点主要分以下几大类，网站管理促销和工具国际化支持SEO搜索引擎优化结账方式运输快递支付方式客户服务用户帐户目录管理目录浏览产品展示分析和报表Magento 1.6 主要包含以下新特性：•持久性购物 - 为不同的

下载

实操建议：

别用 WHERE created_at = (SELECT MAX(created_at) ...)：当有多个记录时间戳相同时，会返回多行，业务逻辑直接崩
MySQL 8.0+ 推荐 ROW_NUMBER() OVER (PARTITION BY product_id ORDER BY created_at DESC, id DESC)，用 id 补充排序确保唯一性，然后外层 WHERE rn = 1
如果只要单字段（比如只取最新 status），用 FIRST_VALUE(status) OVER (PARTITION BY product_id ORDER BY created_at DESC, id DESC) 比开窗再过滤更省内存

ORDER BY 在 GROUP BY 之后还能用索引吗

能，但条件苛刻：必须满足「ORDER BY 的列全部来自 GROUP BY 的列，或来自聚合函数结果，且顺序一致」。一旦混入非分组列（比如 ORDER BY name 但 name 不在 GROUP BY 里），立刻退化为 filesort。

实操建议：

检查执行计划里是否出现 Using filesort，出现即代表排序失效；用 EXPLAIN FORMAT=TREE（MySQL 8.0+）能看清是否用了索引排序
想按 COUNT(*) 降序排？确保 GROUP BY 列上有复合索引，例如 (category_id, user_id)，这样 GROUP BY category_id ORDER BY COUNT(*) DESC 才可能走索引扫描
PostgreSQL 对此更敏感，ORDER BY COUNT(*) 几乎必走排序，不如在应用层收数据后做排序，尤其当分组数少于几千时，反而更快

分组和排名看似简单，真正卡住人的永远是「执行计划看不见的路径选择」和「不同版本 SQL 引擎对同一语法的实际处理差异」。调优前先看 EXPLAIN，别信直觉，也别抄网上旧教程里的写法——MySQL 5.7 和 8.0.33 对 ROW_NUMBER() 的优化程度差得远。

相关标签:

sql mysql NULL count select format Session using 并发 postgresql

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 正则表达式性能优化方法下一篇：SQL 动态 SQL 的 PREPARE 与参数绑定防注入实践

作者最新文章

红米手机微信电话铃声不响_红米手机微信铃声设置修复教程

2026-02-13 10:47

HTTPS://MANWA.3ME漫蛙MANWA怎么切漫蛙直达入口

2026-02-13 10:51

发票抽奖是专票还是普票发票抽奖什么时候开始实施

2026-02-13 11:08

HTTP://YANDEX.COM YANDEX COM入口

2026-02-13 11:08

发票抽奖在税务系统怎么参加发票抽奖注意事项和技巧

2026-02-13 11:26

华为为什么卖掉荣耀荣耀独立出售原因解析

2026-02-13 12:02

战神三部曲重制版预告公布战神三部曲重制版最新消息

2026-02-13 12:07

崩坏:星穹铁道4.0最新攻略星铁4.0全流程指南【一图流】

2026-02-13 12:07

有兽焉全新OP播放链接有兽焉新OP官方画面网页入口

2026-02-13 12:17

rsync 报 "no space left on device" 的目标磁盘 inode / 权限检查

2026-02-13 14:03

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

942

2023.10.12