SQL pt-online-schema-change 的 chunk-size 与 throttle 调优实践

冷炫風刃

发布时间：2026-02-15 16:04:03

886人浏览过

来源于php中文网

原创

chunk-size过小会导致事务开销剧增、binlog写放大、从库延迟升高，并使--throttle误判负载而频繁休眠，引发执行停滞；建议从1000起步实测调优。

sql pt-online-schema-change 的 chunk-size 与 throttle 调优实践

chunk-size 设定过小会导致什么

pt-online-schema-change 每次只改一小块数据，靠 chunk-size 控制单次处理行数。设得太小（比如 100），会显著放大事务开销和锁等待：

每个 chunk 都要启一个新事务、查主键范围、做 INSERT/UPDATE、再校验，频繁提交让 binlog 写放大、从库延迟跳升
更致命的是，小 chunk 会让 --throttle 判定更敏感——哪怕只是临时 IO 尖峰，也容易被误判为“过载”，主动 sleep，整体耗时翻倍甚至停滞

常见现象：执行日志里反复出现 Throttling due to load，但 SHOW PROCESSLIST 看不到明显阻塞，CPU 和磁盘 IO 实际利用率却很低。

建议从 1000 起步，在低峰期实测：

--chunk-size=1000 + --throttle=50（单位 ms）先跑 5 分钟，观察 Threads_running 和 Innodb_row_lock_time_avg
若锁等待时间稳定 5000；若 > 5ms，说明表热点集中，得降回 1000 并考虑拆分 WHERE 条件

throttle 值不是越小越安全

--throttle 的作用是“每处理完一个 chunk 后，检查系统负载，超阈值就睡一会”。它不控制单次操作快慢，只管“喘气节奏”。

设成 1 或 5 看似保守，实际反而危险：

太频繁的负载探测（每毫秒一次）本身就会增加性能抖动，尤其在高并发写入场景下，可能触发 MySQL 内部状态采样竞争
它只看 Threads_running 和 Threads_connected，对磁盘 IO、内存压力、复制延迟完全无感——你卡在 IO 上，它还傻等连接数下来

真正该盯的是：

AISEO

AI创作对SEO友好的文案和文章

下载

SHOW GLOBAL STATUS LIKE 'Threads_running' 长期 > 30？说明并发已饱和，--throttle 可设 100 强制降速
主从延迟 > 30s？优先关掉 --throttle，用 --max-lag 控制复制 lag，否则 throttle 睡眠根本救不了从库

chunk-size 和 throttle 必须配合 where 条件用

pt-online-schema-change 默认按主键范围切 chunk，但如果加了 --where，行为会变：

--where "status='pending'" 这种非主键条件，会导致每个 chunk 都要全表扫描过滤，chunk-size=1000 可能实际扫 5 万行才凑够 1000 条
此时 --throttle 的休眠反而掩盖了真实瓶颈——你以为是负载高，其实是索引没走对

验证方法很简单：

加 --dry-run 和 --print，看生成的 SELECT 语句是否命中索引（用 EXPLAIN 手动跑一遍）
如果 type 是 ALL 或 index，必须给 --where 字段建索引，否则 chunk-size 再大也没用
索引存在但没走？可能是统计信息过期，ANALYZE TABLE 一下再试

别信默认值，生产环境必须压测验证

pt-online-schema-change 的默认 chunk-size=1000 和无 --throttle，只适合测试库。线上表行数超千万、QPS > 500 时，这两值基本无效。

压测关键动作：

用 --dry-run --execute --print 先导出真实 SQL，拿慢查询日志里的典型 UPDATE/INSERT 拆出来，在从库上用 sysbench 或 mysqlslap 模拟并发压
观察 Innodb_buffer_pool_wait_free 是否上涨——涨了说明 buffer pool 不够，chunk-size 得往小调
开启 --progress=time,5，对比不同配置下每 5 秒完成的 chunk 数，波动超过 ±30% 就说明当前组合不稳定

最常被忽略的一点：
--chunk-index 默认用主键，但如果主键是 UUID 或写入热点集中在某一段（比如时间戳倒序），chunk 切片会严重不均——前几个 chunk 很快，后几个卡死。这时候得手动指定一个分布均匀的索引，哪怕多建一个 created_at 单列索引也比硬扛强。

相关标签:

sql mysql print select 切片并发 table

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 物化视图（materialized view）的增量刷新 vs 全量刷新的触发策略下一篇：暂无

作者最新文章

木兰诗全文朗诵完整版木兰诗全文朗诵拼音

2026-02-13 11:05

发票抽奖怎么参加发票抽奖什么时候开始

2026-02-13 11:07

GitHub 有没有永久收藏夹？GitHub Star 与收藏管理使用说明

2026-02-13 11:31

华为荣耀怎么设置后运行的程序后台程序管理与设置

2026-02-13 11:38

发票抽奖中奖几率有多大发票抽奖怎么提高中奖率

2026-02-13 11:44

2026以旧换新汽车补贴新政策大全汽车以旧换新补贴领取教程

2026-02-13 11:48

中小微企业贷款贴息政策有哪些中小微企业贷款贴息政策内容解读

2026-02-13 12:03

中小微企业贷款贴息怎么申请中小微企业贷款贴息怎么参与

2026-02-13 12:14

GitHub 官网加载不出来怎么办？访问失败原因与解决方案

2026-02-13 12:15

Go http 客户端连接池怎么调优？

2026-02-13 13:01

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

943

2023.10.12