0

0

mysql执行计划中的统计信息是如何采集的_mysql Analyze Table原理

P粉602998670

P粉602998670

发布时间:2026-03-07 05:23:11

|

321人浏览过

|

来源于php中文网

原创

mysql统计信息是抽样估算值而非精确计算,基于随机采样数据页推算基数与选择性;采样页数影响精度与性能;持久化开启时存于系统表,重启不丢失;自动更新依赖行变更比例估算,不实时;analyze table强制重采样并覆盖统计信息,适用于执行计划劣化场景;直方图可增强列值分布估算,需手动更新且依赖持久化;判断不准需结合实际执行表现与多源数据比对。

mysql执行计划中的统计信息是如何采集的_mysql analyze table原理

统计信息不是“算出来”的,而是“抽样估算”出来的

MySQL 的统计信息(比如 CARDINALITYTABLE_ROWS)本质上是采样估算值,不是全表扫描后精确统计的。InnoDB 默认对每个索引随机抽取若干数据页(默认 innodb_stats_persistent_sample_pages=20),再基于这些页中键值的分布推算整个索引的基数和选择性。

  • 采样页数越少,收集快但不准;越多越准但耗时长,尤其对大表可能卡住 DML
  • 持久化开启(innodb_stats_persistent=ON,默认)时,采样结果存到 mysql.innodb_table_statsmysql.innodb_index_stats 表里,重启不丢
  • 关闭持久化后,统计信息只存在内存,重启即清空,下次访问表或执行 SHOW TABLE STATUS 会触发重新采样(若 innodb_stats_on_metadata=ON
  • 自动更新由 innodb_stats_auto_recalc 控制:默认 ON,当表变更行数超过约 10% 时后台异步触发 —— 但这个“10%”是估算的计数器,不精确,且不会实时刷新

ANALYZE TABLE 干了什么?为什么有时要手动跑

ANALYZE TABLE 不是“重新计算所有行”,而是强制触发一次新的采样,并用结果覆盖当前统计信息(内存 + 持久化表)。它适用于自动更新没跟上、执行计划明显变差的场景,比如大批次 DELETEINSERT 后。

设计师AI工具箱
设计师AI工具箱

最懂设计师的效率提升平台,实现高效设计出图和智能改图,室内设计,毛坯渲染,旧房改造 ,软装设计

下载
  • 对大表执行 ANALYZE TABLE 会加 MDL_SHARED_NO_WRITE 锁,阻塞 DDL,但不阻塞普通 DML(如 INSERT/UPDATE/SELECT
  • 如果表有分区,ANALYZE TABLE 默认只分析一级分区元数据,不深入每个子分区(除非 MySQL ≥ 8.0.23 且显式指定)
  • 想跳过写 binlog(避免从库重复执行),可用 ANALYZE NO_WRITE_TO_BINLOG TABLE tbl
  • 不要在高峰期对几百 GB 的表频繁跑 —— 它会读取大量随机页,可能引发 I/O 尖峰

直方图(UPDATE HISTOGRAM)是统计信息的“增强包”

基础统计信息只提供全局基数,无法描述列值分布倾斜(比如 95% 的 status='active',5% 是其他值)。这时需要直方图:ANALYZE TABLE t UPDATE HISTOGRAM ON col_name WITH 16 BUCKETS

  • 直方图只影响优化器对 WHERE 条件的选择性估算,不影响索引本身的 CARDINALITY
  • 必须配合 innodb_stats_persistent=ON 才能持久保存;否则每次重启丢失
  • 桶数(BUCKETS)不是越多越好:16–64 足够覆盖常见倾斜,超 256 容易拖慢 EXPLAIN 解析速度
  • 直方图不自动更新 —— 数据大幅变化后,得手动再跑 UPDATE HISTOGRAM,否则形同虚设

怎么判断统计信息“不准”?别只看 EXPLAIN 的 rows

EXPLAIN 中的 rows 列只是估算值,本身不准不说明问题;关键是看实际执行是否走错索引、JOIN 顺序反常、或 type 突然变成 ALL

  • 对比 SELECT COUNT(*) FROM tINFORMATION_SCHEMA.TABLES.TABLE_ROWS:差 3 倍以上就值得怀疑
  • SHOW INDEX FROM t,看 CARDINALITY 是否明显偏离真实唯一值数量(比如 CARDINALITY=1 但你知道该字段几乎全唯一)
  • 执行 EXPLAIN FORMAT=JSON SELECT ...,检查 "rows_estimation" 下各表的 "row_count" 是否严重偏离预期
  • 注意:INFORMATION_SCHEMA.STATISTICSCARDINALITY 是内存缓存值,可能滞后;真正权威的是 mysql.innodb_index_stats 里的 n_diff_pfx01 字段
统计信息不准最麻烦的地方不在“难修”,而在“难发现”——它常常静默导致慢查询,却不像锁等待或连接数爆满那样有明显告警信号。定期用脚本比对 TABLE_ROWS 和实际 COUNT,比等业务报慢更靠谱。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
mysql修改数据表名
mysql修改数据表名

MySQL修改数据表:1、首先查看数据库中所有的表,代码为:‘SHOW TABLES;’;2、修改表名,代码为:‘ALTER TABLE 旧表名 RENAME [TO] 新表名;’。php中文网还提供MySQL的相关下载、相关课程等内容,供大家免费下载使用。

685

2023.06.20

MySQL创建存储过程
MySQL创建存储过程

存储程序可以分为存储过程和函数,MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名),也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容,供大家免费下载使用。

493

2023.06.21

mongodb和mysql的区别
mongodb和mysql的区别

mongodb和mysql的区别:1、数据模型;2、查询语言;3、扩展性和性能;4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容,供大家免费下载体验。

287

2023.07.18

mysql密码忘了怎么查看
mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

519

2023.07.19

mysql创建数据库
mysql创建数据库

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

266

2023.07.25

mysql默认事务隔离级别
mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统,它支持事务处理。事务是一组数据库操作,它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性,MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

392

2023.08.08

sqlserver和mysql区别
sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途,但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

542

2023.08.11

mysql忘记密码
mysql忘记密码

MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢?php中文网给大家带来了相关的教程以及其他关于mysql的文章,欢迎大家前来学习阅读。

666

2023.08.14

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

1

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 2.5万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 844人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号