mysql执行计划中的统计信息是如何采集的_mysql Analyze Table原理

P粉602998670

发布时间：2026-03-07 05:23:11

321人浏览过

来源于php中文网

原创

mysql统计信息是抽样估算值而非精确计算，基于随机采样数据页推算基数与选择性；采样页数影响精度与性能；持久化开启时存于系统表，重启不丢失；自动更新依赖行变更比例估算，不实时；analyze table强制重采样并覆盖统计信息，适用于执行计划劣化场景；直方图可增强列值分布估算，需手动更新且依赖持久化；判断不准需结合实际执行表现与多源数据比对。

mysql执行计划中的统计信息是如何采集的_mysql analyze table原理

统计信息不是“算出来”的，而是“抽样估算”出来的

MySQL 的统计信息（比如 CARDINALITY、TABLE_ROWS）本质上是采样估算值，不是全表扫描后精确统计的。InnoDB 默认对每个索引随机抽取若干数据页（默认 innodb_stats_persistent_sample_pages=20），再基于这些页中键值的分布推算整个索引的基数和选择性。

采样页数越少，收集快但不准；越多越准但耗时长，尤其对大表可能卡住 DML
持久化开启（innodb_stats_persistent=ON，默认）时，采样结果存到 mysql.innodb_table_stats 和 mysql.innodb_index_stats 表里，重启不丢
关闭持久化后，统计信息只存在内存，重启即清空，下次访问表或执行 SHOW TABLE STATUS 会触发重新采样（若 innodb_stats_on_metadata=ON）
自动更新由 innodb_stats_auto_recalc 控制：默认 ON，当表变更行数超过约 10% 时后台异步触发 —— 但这个“10%”是估算的计数器，不精确，且不会实时刷新

`ANALYZE TABLE` 干了什么？为什么有时要手动跑

ANALYZE TABLE 不是“重新计算所有行”，而是强制触发一次新的采样，并用结果覆盖当前统计信息（内存 + 持久化表）。它适用于自动更新没跟上、执行计划明显变差的场景，比如大批次 DELETE 或 INSERT 后。

设计师AI工具箱

最懂设计师的效率提升平台，实现高效设计出图和智能改图，室内设计，毛坯渲染，旧房改造，软装设计

下载

对大表执行 ANALYZE TABLE 会加 MDL_SHARED_NO_WRITE 锁，阻塞 DDL，但不阻塞普通 DML（如 INSERT/UPDATE/SELECT）
如果表有分区，ANALYZE TABLE 默认只分析一级分区元数据，不深入每个子分区（除非 MySQL ≥ 8.0.23 且显式指定）
想跳过写 binlog（避免从库重复执行），可用 ANALYZE NO_WRITE_TO_BINLOG TABLE tbl
不要在高峰期对几百 GB 的表频繁跑 —— 它会读取大量随机页，可能引发 I/O 尖峰

直方图（`UPDATE HISTOGRAM`）是统计信息的“增强包”

基础统计信息只提供全局基数，无法描述列值分布倾斜（比如 95% 的 status='active'，5% 是其他值）。这时需要直方图：ANALYZE TABLE t UPDATE HISTOGRAM ON col_name WITH 16 BUCKETS。

直方图只影响优化器对 WHERE 条件的选择性估算，不影响索引本身的 CARDINALITY
必须配合 innodb_stats_persistent=ON 才能持久保存；否则每次重启丢失
桶数（BUCKETS）不是越多越好：16–64 足够覆盖常见倾斜，超 256 容易拖慢 EXPLAIN 解析速度
直方图不自动更新 —— 数据大幅变化后，得手动再跑 UPDATE HISTOGRAM，否则形同虚设

怎么判断统计信息“不准”？别只看 `EXPLAIN` 的 rows

EXPLAIN 中的 rows 列只是估算值，本身不准不说明问题；关键是看实际执行是否走错索引、JOIN 顺序反常、或 type 突然变成 ALL。

对比 SELECT COUNT(*) FROM t 和 INFORMATION_SCHEMA.TABLES.TABLE_ROWS：差 3 倍以上就值得怀疑
查 SHOW INDEX FROM t，看 CARDINALITY 是否明显偏离真实唯一值数量（比如 CARDINALITY=1 但你知道该字段几乎全唯一）
执行 EXPLAIN FORMAT=JSON SELECT ...，检查 "rows_estimation" 下各表的 "row_count" 是否严重偏离预期
注意：INFORMATION_SCHEMA.STATISTICS 的 CARDINALITY 是内存缓存值，可能滞后；真正权威的是 mysql.innodb_index_stats 里的 n_diff_pfx01 字段

统计信息不准最麻烦的地方不在“难修”，而在“难发现”——它常常静默导致慢查询，却不像锁等待或连接数爆满那样有明显告警信号。定期用脚本比对 TABLE_ROWS 和实际 COUNT，比等业务报慢更靠谱。

mysql如何使用位运算符_mysql二进制数据处理

mysql如何使用case when实现条件判断_mysql条件表达式

mysql主从复制的数据一致性如何保证_mysql一致性方案

mysql触发器如何解决数据一致性问题_mysql实战案例

mysql权限管理如何与LDAP集成_mysql认证与集成方案

相关专题

mysql修改数据表名

MySQL修改数据表：1、首先查看数据库中所有的表，代码为：‘SHOW TABLES；’；2、修改表名，代码为：‘ALTER TABLE 旧表名 RENAME [TO] 新表名；’。php中文网还提供MySQL的相关下载、相关课程等内容，供大家免费下载使用。

685

2023.06.20

MySQL创建存储过程

存储程序可以分为存储过程和函数，MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名)，也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容，供大家免费下载使用。

493

2023.06.21

mongodb和mysql的区别

mongodb和mysql的区别：1、数据模型；2、查询语言；3、扩展性和性能；4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容，供大家免费下载体验。

287

2023.07.18

mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统，由瑞典MySQL AB 公司开发，属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一，在 WEB 应用方面，MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

519

2023.07.19

mysql创建数据库

MySQL是一个关系型数据库管理系统，由瑞典MySQL AB 公司开发，属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一，在 WEB 应用方面，MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

266

2023.07.25

mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统，它支持事务处理。事务是一组数据库操作，它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性，MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

392

2023.08.08

sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途，但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

542

2023.08.11

mysql忘记密码

MySQL是一种关系型数据库管理系统，关系数据库将数据保存在不同的表中，而不是将所有数据放在一个大仓库内，这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢？php中文网给大家带来了相关的教程以及其他关于mysql的文章，欢迎大家前来学习阅读。

666

2023.08.14

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

热门下载

网站特效

网站源码

网站素材

前端模板