0

0

mysql如何优化GROUP BY操作_mysql松散索引扫描应用

P粉602998670

P粉602998670

发布时间:2026-03-15 13:28:03

|

475人浏览过

|

来源于php中文网

原创

GROUP BY 慢主要因未触发松散索引扫描,导致使用临时表或文件排序;需满足单表、最左前缀索引、无非等值WHERE、仅用MIN/MAX/COUNT(*)等条件。

mysql如何优化group by操作_mysql松散索引扫描应用

GROUP BY 为什么慢?先看执行计划里有没有 Using filesortUsing temporary

MySQL 对 GROUP BY 的优化依赖是否能走索引扫描,而不是回表或临时表。如果 EXPLAIN 输出里出现 Using filesortUsing temporary,基本说明没走松散索引扫描(Loose Index Scan),而是用了紧凑索引扫描(Tight Index Scan)——也就是逐行读、再聚合,I/O 和 CPU 开销都大。

松散索引扫描不是“开关”,是优化器在满足特定条件时自动启用的策略:它跳着读索引,只取每组第一个值,跳过组内其余行。但这个“跳”很娇气,稍有不匹配就退化。

  • 必须是单表查询,不能有 JOIN、子查询、UNION
  • GROUP BY 字段必须是索引最左前缀,且顺序完全一致(比如索引是 (a,b,c),那 GROUP BY a,b 可以,GROUP BY b,a 就不行)
  • 不能有 WHERE 条件过滤非最左字段(比如索引 (a,b)WHERE b = 1 会强制全索引扫描)
  • 聚合函数仅限 MIN()MAX()COUNT(*);用 SUM()AVG() 或带 DISTINCT 的函数会禁用松散扫描

怎么建索引才能触发松散索引扫描

核心是让索引覆盖 GROUP BY 列 + 所有 SELECT 中的非聚合列(即“功能依赖”列)。例如:SELECT a, MAX(b) FROM t GROUP BY a,理想索引是 (a,b) —— a 支持分组定位,b 支持直接取最大值而无需回表。

注意:如果语句里有 ORDER BY a,和 GROUP BY a 一致,不会额外开销;但如果 ORDER BY b,即使 b 在索引里,也可能导致优化器放弃松散扫描改走排序。

  • 避免冗余字段:索引 (a,b,c) 用于 GROUP BY a 是浪费,c 不参与分组也不被聚合引用时,拖慢索引体积和维护成本
  • 复合索引中,把等值条件字段放最左,再放 GROUP BY 字段,最后放用于 MIN/MAX 的字段(如 WHERE status=1 GROUP BY category ORDER BY created_at DESC → 索引 (status, category, created_at)
  • 5.7+ 版本支持函数索引(虚拟列+索引),对表达式分组(如 GROUP BY DATE(created_at))可建虚拟列再索引,否则必然全表扫

常见踩坑:明明建了索引,GROUP BY 还是慢

最典型的是隐式类型转换。比如字段是 VARCHAR,但 WHERE 条件写了 WHERE group_id = 123(整型字面量),MySQL 会把每行 group_id 转成数字比对,索引失效,自然也废掉松散扫描机会。

ChatDOC
ChatDOC

ChatDOC是一款基于chatgpt的文件阅读助手,可以快速从pdf中提取、定位和总结信息

下载

另一个高频问题是 SQL_MODEONLY_FULL_GROUP_BY 时,MySQL 会拒绝“非函数依赖列出现在 SELECT 中”的语句,表面报错,实则可能让你加了不必要的 ANY_VALUE() 或改成 MAX(),结果反而破坏了松散扫描前提(比如把 SELECT name 改成 SELECT MAX(name),而 name 不在索引里)。

  • 检查字符集/排序规则是否一致:联结字段或 WHERE 字段若跨不同 COLLATION,也会触发隐式转换
  • GROUP BY 后跟常量(如 GROUP BY 1)或表达式(如 GROUP BY a+1)一定无法使用索引
  • 分区表上 GROUP BY 默认不合并各分区结果,除非明确写 GROUP BY ... PARTITION 语法(8.0+),否则性能更差

替代方案:当松散索引扫描不可用时,还能做什么

如果业务逻辑复杂、字段多、又必须用 SUMAVG,松散扫描基本无望。这时候与其硬调索引,不如换思路:预聚合。

比如高频查询 “每个分类的销量总和”,与其每次 SELECT category, SUM(sales) FROM orders GROUP BY category,不如用定时任务或触发器把结果写入汇总表 category_sales_summary(category, total_sales, updated_at),查询直接走主键。

  • 汇总表更新要控制频率:实时性要求低的场景,用 INSERT ... ON DUPLICATE KEY UPDATE 每小时刷一次比每单都更新更稳
  • 临时表 + 强制索引有时比原表快:对大表先 CREATE TEMPORARY TABLE t2 AS SELECT ... WHERE ...,再在 t2GROUP BY,尤其当原表有大量无效数据时
  • SQL_CALC_FOUND_ROWS 已废弃,别在分页 GROUP BY 场景里用;总数单独查 SELECT COUNT(DISTINCT category) 更可靠

松散索引扫描看着很美,但它的生效边界非常窄。真正卡住性能的,往往不是“没建对索引”,而是“以为建了索引就万事大吉”,忽略了条件顺序、类型一致性、甚至 SQL_MODE 的连锁影响。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
mysql修改数据表名
mysql修改数据表名

MySQL修改数据表:1、首先查看数据库中所有的表,代码为:‘SHOW TABLES;’;2、修改表名,代码为:‘ALTER TABLE 旧表名 RENAME [TO] 新表名;’。php中文网还提供MySQL的相关下载、相关课程等内容,供大家免费下载使用。

686

2023.06.20

MySQL创建存储过程
MySQL创建存储过程

存储程序可以分为存储过程和函数,MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名),也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容,供大家免费下载使用。

534

2023.06.21

mongodb和mysql的区别
mongodb和mysql的区别

mongodb和mysql的区别:1、数据模型;2、查询语言;3、扩展性和性能;4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容,供大家免费下载体验。

287

2023.07.18

mysql密码忘了怎么查看
mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

520

2023.07.19

mysql创建数据库
mysql创建数据库

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

267

2023.07.25

mysql默认事务隔离级别
mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统,它支持事务处理。事务是一组数据库操作,它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性,MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

392

2023.08.08

sqlserver和mysql区别
sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途,但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

542

2023.08.11

mysql忘记密码
mysql忘记密码

MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢?php中文网给大家带来了相关的教程以及其他关于mysql的文章,欢迎大家前来学习阅读。

668

2023.08.14

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

69

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 2.6万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 850人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号