mysql如何排查Undo Log暴涨问题_mysql长事务监控与回滚分析

P粉602998670

发布时间：2026-03-13 14:11:31

469人浏览过

来源于php中文网

原创

应查询information_schema.INNODB_TRX表中TRX_STATE='RUNNING'且TRX_STARTED远早于当前时间、TRX_ROWS_MODIFIED极大的长事务，并关联PROCESSLIST定位SQL；因其阻塞purge线程导致Undo Log无法清理。

mysql如何排查undo log暴涨问题_mysql长事务监控与回滚分析

查哪些事务在疯狂写Undo Log

Undo Log暴涨通常不是突然发生的，而是被长时间未提交的事务持续占用空间导致。最直接的办法是看当前活跃事务里谁卡住了：information_schema.INNODB_TRX 是核心入口，重点关注 TRX_STARTED、TRX_STATE 和 TRX_ROWS_MODIFIED 字段。

TRX_STATE = 'RUNNING' 且 TRX_STARTED 时间远早于当前时间（比如几小时甚至几天），基本就是嫌疑对象
TRX_ROWS_MODIFIED 数值极大（如 >10万）但事务没提交，说明它一边改数据一边把旧版本全堆进Undo Log
搭配 information_schema.PROCESSLIST 查 ID 对应的 INFO 字段，能定位到具体SQL，比如 UPDATE orders SET status = 'done' WHERE user_id IN (...) 这类批量更新没加 LIMIT 又没提交

为什么长事务会让Undo Log删不掉

MySQL 的 Undo Log 不是“用完即焚”，它得留着供其他并发事务做 MVCC 一致性读。只要有一个老事务还开着，哪怕它啥都不干，所有它启动时刻之后产生的 Undo Log 都不能被 purge 线程清理。

InnoDB 的 purge_sys 只能清理“早于最老活跃事务快照”的Undo页，这个最老事务就是瓶颈点
如果应用层用了 SET autocommit = 0 却忘了 COMMIT 或 ROLLBACK，或者 ORM 框架连接池配置不当导致事务泄漏，就会卡住整个 purge 流程
注意：只读事务（TRX_ISOLATION_LEVEL = 'REPEATABLE READ' 且没执行写操作）也会持有快照，但不会新增 Undo；真正危险的是“写+不提交”

监控和自动发现长事务的实用命令

别等磁盘告警才去查，得把检测变成日常巡检动作。以下命令可直接丢进脚本或Prometheus exporter里：

云从科技AI开放平台

云从AI开放平台

下载

SELECT 
  trx_id,
  trx_started,
  TIME_TO_SEC(TIMEDIFF(NOW(), trx_started)) AS duration_sec,
  trx_state,
  trx_rows_modified,
  SUBSTRING_INDEX(trx_mysql_thread_id, ':', 1) AS thread_id
FROM information_schema.INNODB_TRX 
WHERE TIME_TO_SEC(TIMEDIFF(NOW(), trx_started)) > 600;

阈值设成 600 秒（10分钟）比较合理，太短会误报，太长可能已造成空间压力
结果里的 thread_id 可直接关联 information_schema.PROCESSLIST.ID 查原始SQL和客户端IP
生产环境建议加 ORDER BY duration_sec DESC LIMIT 5，优先盯住Top 5“钉子户”

回滚失败或卡死时怎么安全处理

发现长事务后第一反应不是立刻 KILL，尤其当 TRX_ROWS_MODIFIED 很大时，强行中断会导致回滚过程本身吃满IO、拖慢整个实例。

先确认它是否还在活动：查 PROCESSLIST.COMMAND 是否为 'Sleep' 或 'Query'，如果是 'Killed' 就别动，等它自己结束
如果必须终止，优先用 KILL QUERY {thread_id} 中断当前语句（不杀连接），比 KILL {thread_id} 更温和
回滚中出现 Lock wait timeout exceeded 或 InnoDB: Trying to access page number ... in space 0 错误，说明Undo页已损坏或系统资源耗尽，此时只能重启实例——但务必先备份 ibdata1 和 binlog 位置

真正麻烦的不是查出长事务，而是它背后那个没加超时控制的业务逻辑。比如一个导出接口手动开启事务却依赖前端点击“完成”才提交，用户关了页面，事务就永远挂着。

mysql数据库中的主键与外键定义与使用

mysql升级前如何测试升级流程_mysql测试环境实践

mysql如何使用控制流函数IF_mysql SQL语句内嵌逻辑

mysql如何处理复制链路中的版本不一致_mysql跨版本主从兼容性

mysql主从复制是否支持双主架构_双主模式配置

相关标签:

mysql sql mysql 接口堆线程并发 number 对象 prometheus Access

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：mysql如何管理自增主键的溢出风险_mysql主键类型安全管理下一篇：暂无

作者最新文章

mysql如何使用BETWEEN范围查询_mysql数值与日期区间筛选

2026-03-13 09:52

mysql如何配置日志目录_mysql自定义日志路径设置

2026-03-13 09:53

Java中的方法内联(Method Inlining)是什么_减少方法调用开销原理

2026-03-13 09:53

如何理解Java中的协同进化_父类与子类功能的同步更新

2026-03-13 09:54

Python怎么画柱状图_多维分类数据对比与堆叠柱状图颜色映射实现

2026-03-13 09:55

如何在Java中获取Map的所有Value_values方法与集合流转换

2026-03-13 09:56

mysql如何处理升级后SQL_MODE变化_mysql严格模式兼容调整

2026-03-13 09:56

怎么在Spring Boot中使用RedisTemplate序列化对象_JSON序列化器的自定义设置

2026-03-13 09:56

深度掌握Navicat全局查找与替换字符技巧_高级开发者实战

2026-03-13 09:57

Python Django怎么跑定时任务_Celery分布式集成与异步任务队列Redis Broker配置

2026-03-13 09:57

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1134

2023.10.12