0

0

mysql如何通过ANALYZE优化索引统计_mysql索引统计信息维护

P粉602998670

P粉602998670

发布时间:2026-03-16 12:23:02

|

901人浏览过

|

来源于php中文网

原创

必须手动执行ANALYZE TABLE的场景包括:大批量导入数据后、大范围UPDATE/DELETE导致列分布剧变、新建索引后首次查询慢、慢查询执行计划异常且EXPLAIN显示rows估算偏差超一个数量级。

mysql如何通过analyze优化索引统计_mysql索引统计信息维护

ANALYZE TABLE 什么时候必须手动执行

MySQL 的 ANALYZE TABLE 不是“一劳永逸”的操作,它只在统计信息过期或严重失准时才值得触发。InnoDB 默认会自动采样更新统计信息(innodb_stats_auto_recalc=ON),但这个机制有明确限制:只有当表中约 10% 的数据发生变更时,才会触发自动更新。这意味着小表可能长期不更新,大表即使改了百万行,只要没跨过 10% 阈值,优化器看到的仍是旧分布。

常见必须手动跑的场景包括:

  • 刚导入大量历史数据(比如从 CSV 批量 LOAD DATA INFILE 后)
  • 执行完大范围 UPDATE / DELETE(尤其影响选择性高的列,如 status 列从 95% 'active' 变成 40% 'active')
  • 新建索引后首次查询性能差——优化器还没见过这个索引的基数(cardinality)
  • 慢查询执行计划突然走错(比如该走 idx_user_id 却用了全表扫描),且 EXPLAIN 显示 rows 估算偏差超一个数量级

ANALYZE TABLE 和 FORCE 的区别与风险

ANALYZE TABLE t1 是默认行为,InnoDB 用随机页采样估算统计信息,快但不够精确;加 FORCED(即 ANALYZE TABLE t1 FORCED)会让 InnoDB 扫描全部索引页,生成更准的统计,代价是锁表时间显著变长、I/O 压力大,且在高并发写入时可能阻塞 DML。

别盲目加 FORCED,除非你确认:

  • 表小于 1GB,且业务低峰期可接受秒级锁表
  • 普通 ANALYZESHOW INDEX FROM t1 中关键索引的 Cardinality 值明显不合理(比如唯一索引显示 Cardinality = 1
  • 对比过 information_schema.STATISTICSSEQ_IN_INDEX 和实际数据分布,发现采样严重偏斜

注意:FORCED 在 MySQL 8.0.23+ 已被弃用,推荐改用 ANALYZE TABLE t1 PERSISTENT FOR ALL(需先开启 innodb_stats_persistent)。

统计信息不准导致的典型执行计划误判

最常被忽略的是“索引选择性误估”:比如 created_at 上有索引,但统计信息认为该列高度重复(Cardinality 很低),优化器就放弃走索引,改用全表扫描——哪怕你只查最近 1 小时的数据。这种问题不会报错,只会默默变慢。

课游记AI
课游记AI

AI原生学习产品

下载

验证是否是统计问题,分两步:

  • 查当前统计:SELECT TABLE_NAME, INDEX_NAME, CARDINALITY FROM information_schema.STATISTICS WHERE TABLE_SCHEMA='your_db' AND TABLE_NAME='t1' ORDER BY SEQ_IN_INDEX;
  • 人工估算:对关键列运行 SELECT COUNT(DISTINCT created_at) / COUNT(*) FROM t1;,如果结果接近 1(高选择性),但 CARDINALITY 却远小于总行数,基本就是统计滞后

另一个坑是分区表:ANALYZE TABLE 默认只分析元数据,不分析每个分区,得显式写成 ANALYZE TABLE t1 PARTITION(p202401)

生产环境执行 ANALYZE 的安全习惯

别在高峰期直接敲命令。InnoDB 虽支持在线 ANALYZE(不阻塞读,但会短暂阻塞写),但锁竞争和 I/O 尖刺仍可能波及其他查询。

  • 优先用低权重方式:SET SESSION innodb_stats_sample_pages = 25; ANALYZE TABLE t1;(默认是 20,提高到 25 能小幅提升精度,又不显著拖慢)
  • 避开主从延迟敏感时段:因为 ANALYZE 是 DDL,会写 binlog,从库重放期间也可能卡住复制线程
  • 避免在 autocommit=0 事务里执行——它会隐式提交当前事务,容易引发意外交互
  • 监控后续效果:执行后立刻跑 EXPLAIN FORMAT=JSON SELECT ...,重点看 rows_estimated 是否贴近真实返回行数

真正麻烦的不是怎么跑 ANALYZE,而是你怎么知道它该跑了——得盯住 slow_log 里反复出现的“本该走索引却没走”的查询,再反查统计信息,这一步最容易被跳过。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
mysql修改数据表名
mysql修改数据表名

MySQL修改数据表:1、首先查看数据库中所有的表,代码为:‘SHOW TABLES;’;2、修改表名,代码为:‘ALTER TABLE 旧表名 RENAME [TO] 新表名;’。php中文网还提供MySQL的相关下载、相关课程等内容,供大家免费下载使用。

686

2023.06.20

MySQL创建存储过程
MySQL创建存储过程

存储程序可以分为存储过程和函数,MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名),也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容,供大家免费下载使用。

534

2023.06.21

mongodb和mysql的区别
mongodb和mysql的区别

mongodb和mysql的区别:1、数据模型;2、查询语言;3、扩展性和性能;4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容,供大家免费下载体验。

287

2023.07.18

mysql密码忘了怎么查看
mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

520

2023.07.19

mysql创建数据库
mysql创建数据库

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

267

2023.07.25

mysql默认事务隔离级别
mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统,它支持事务处理。事务是一组数据库操作,它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性,MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

392

2023.08.08

sqlserver和mysql区别
sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途,但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

542

2023.08.11

mysql忘记密码
mysql忘记密码

MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢?php中文网给大家带来了相关的教程以及其他关于mysql的文章,欢迎大家前来学习阅读。

668

2023.08.14

C++多线程并发控制与线程安全设计实践
C++多线程并发控制与线程安全设计实践

本专题围绕 C++ 在高性能系统开发中的并发控制技术展开,系统讲解多线程编程模型与线程安全设计方法。内容包括互斥锁、读写锁、条件变量、原子操作以及线程池实现机制,同时结合实际案例分析并发竞争、死锁避免与性能优化策略。通过实践讲解,帮助开发者掌握构建稳定高效并发系统的关键技术。

2

2026.03.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 2.6万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 853人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号