首先通过查询 information_schema.innodb_trx 获取活跃事务及其执行时长,结合 performance_schema 深度分析事务行为,并利用脚本定期检测 long_trx_threshold 实现告警,必要时借助 slow log 辅助定位,核心是建立自动化监控机制以及时发现并处理长事务,保障数据库稳定。

监控 MySQL 长事务是保障数据库稳定运行的重要手段。长时间运行的事务容易引发锁等待、资源占用过高,甚至导致服务阻塞。通过合理的方法可以及时发现并处理长事务。
1. 使用 information_schema.innodb_trx 查看活跃事务
该表记录了当前正在执行的 InnoDB 事务信息,是识别长事务最直接的方式。
执行以下 SQL 可查看运行时间较长的事务:
SELECT
trx_id,
trx_mysql_thread_id,
trx_started,
TIMESTAMPDIFF(SECOND, trx_started, NOW()) AS duration,
trx_query,
trx_state
FROM information_schema.innodb_trx
ORDER BY duration DESC;
说明:关注 duration 字段,可根据业务情况设定阈值(如超过60秒视为长事务),结合 trx_query 分析具体 SQL 是否存在逻辑问题或未及时提交。
2. 设置 long_trx_threshold 报警(配合脚本)
MySQL 原生不提供长事务告警,但可通过定时脚本检测并通知。
编写一个监控脚本(如 Shell 或 Python),定期查询 innodb_trx 表:
- 连接数据库,执行上述查询
- 判断 duration 是否超过预设阈值(如 300 秒)
- 若存在,记录日志或发送邮件/短信告警
- 可集成到 Zabbix、Prometheus 等监控系统
3. 启用 performance_schema 监控事务行为
performance_schema 提供更细粒度的事务事件记录。
确保开启相关配置:
-- 在 my.cnf 中启用 [mysqld] performance_schema = ON
启用后可查询事务事件:
SELECT * FROM performance_schema.events_transactions_current WHERE nesting_event_type IS NOT NULL;
结合 timer_wait 字段判断事务执行时长,适合深度分析事务生命周期。
4. 利用 general log 或 slow log 辅助分析(谨慎使用)
开启 general log 可记录所有 SQL 操作,便于追溯事务起点,但因性能开销大,仅建议临时开启用于排查。
slow log 可设置 long_query_time 较低值(如 1 秒),捕获执行久的语句,间接提示潜在长事务。
-- 临时开启慢查询日志 SET GLOBAL slow_query_log = 'ON'; SET GLOBAL long_query_time = 1;
基本上就这些常用方法。核心是定期检查 information_schema.innodb_trx,结合脚本实现自动化告警,再辅以 performance_schema 进行深入分析。关键是建立监控机制,避免事务长时间未提交影响系统稳定性。










