vm.dirty_expire_centisecs / dirty_writeback_centisecs 导致脏页回写卡顿的调优

舞夢輝影

发布时间：2026-02-08 16:42:10

784人浏览过

来源于php中文网

原创

改了 vm.dirty_expire_centisecs 仍卡，因未同步调整 vm.dirty_writeback_centisecs；后者需 ≤ 前者（建议设为一半），否则过期脏页无法及时回写。

vm.dirty_expire_centisecs / dirty_writeback_centisecs 导致脏页回写卡顿的调优

为什么改了 `vm.dirty_expire_centisecs` 还是卡？

这个参数控制脏页“过期时间”，单位是厘秒（centiseconds），默认 3000（即 30 秒）。但单纯调小它，比如设成 500（5 秒），并不一定减少卡顿——因为内核真正触发回写，还得看 vm.dirty_writeback_centisecs 是否及时唤醒回写线程。

常见错误是只调 dirty_expire_centisecs，却忽略 dirty_writeback_centisecs 的配合。后者默认 500（5 秒），表示内核每 5 秒唤醒一次 pdflush（或现代内核的 writeback 线程）去扫描过期脏页。如果它太长，即使页已过期，也得等下一轮扫描才开始写，造成延迟堆积。

vm.dirty_writeback_centisecs 应 ≤ vm.dirty_expire_centisecs，否则过期页可能滞留多个周期
生产环境建议设为 dirty_expire_centisecs / 2 左右，例如 expire=1000，则 writeback=500
值过小（如 writeback=100）会导致频繁唤醒线程，增加调度开销，尤其在高 I/O 负载下反而加剧抖动

`vm.dirty_ratio` 和 `vm.dirty_background_ratio` 怎么配合 dirty 回写节奏？

这两个参数决定内存中脏页占比阈值，直接影响是否触发同步/异步回写，和上面两个时间参数共同构成“水位 + 时间”双控机制。

典型卡顿场景：应用突发写入大量数据，dirty_background_ratio（默认 10）很快被突破，内核启动后台回写；但如果磁盘慢，脏页持续累积，逼近 vm.dirty_ratio（默认 20），此时所有新写入线程会被阻塞，直到脏页降到 dirty_ratio 以下——这就是“卡住”的根源。

若磁盘吞吐能力弱（如机械盘、高延迟云盘），适当降低 vm.dirty_background_ratio（如设为 5），让后台回写更早介入
vm.dirty_ratio 不建议低于 10，否则容易因瞬时写入波动就触发阻塞；也不建议高于 30，会显著拉高 OOM 风险
注意：这些 ratio 是相对于 vm.lowmem_reserve_ratio 之外的可用内存计算的，不是总内存百分比

如何验证当前 dirty 回写是否真的成为瓶颈？

别猜，用工具看实际行为。关键指标不是“有没有脏页”，而是“脏页是否堆积 + 回写是否滞后”。

AimiAD

通过 AimiAD 让您的 AI 应用开始赚钱

下载

查实时脏页状态：grep -i dirty /proc/meminfo，重点关注 Dirty: 和 Writeback: 行。如果 Writeback 长时间 > 0 且 Dirty 持续上升，说明回写跟不上
看内核日志是否有 writeback: balance_dirty_pages 相关 trace（需开启 echo 1 > /proc/sys/vm/block_dump 或用 perf），确认是否频繁进入阻塞路径
用 iostat -x 1 观察 %util 和 await：若 await 突增且 Dirty 同步上涨，基本可定位为 dirty 回写压垮磁盘

SSD 和 NVMe 场景下要不要调？

要，但方向相反。SSD/NVMe 的随机写延迟低、并行度高，传统“保守延后写”的策略反而浪费性能。

默认的 30 秒过期时间对 SSD 来说太长，容易导致脏页批量冲刷，引发短时 I/O 尖峰。而 SSD 更适合细粒度、高频次的轻量回写。

可将 vm.dirty_expire_centisecs 降至 500–1000（5–10 秒），vm.dirty_writeback_centisecs 设为 200–500（2–5 秒）
vm.dirty_background_ratio 可适度提高到 15，避免过早触发回写干扰前台 IO；但 vm.dirty_ratio 仍建议维持 20–25，防止内存耗尽
注意：某些 NVMe 驱动或文件系统（如 XFS）对 writeback 线程并发数敏感，若调得太激进，可能触发 writeback: bdi-X: writeback timeout 类似错误

最易被忽略的是：这些参数在容器或 cgroup v2 环境下可能被覆盖，/sys/fs/cgroup/ 下的 memory.pressure 和 io.pressure 才是更直接的信号源。

PostgreSQL 如何用 pg_prewarm 预热表到 shared_buffers

SQL 如何用 EXPLAIN (ANALYZE, BUFFERS) 分析 IO 与缓存命中

SQL 数据校验是否应该自动化？

SQL 数据回溯为何如此困难？

SQL 数据治理为什么离不开规范？

相关标签:

工具 ai ios pdf 为什么 sql echo 堆线程并发异步

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何用 NULLS LAST / NULLS FIRST 控制 NULL 在排序中的位置下一篇：暂无

作者最新文章

强强联手！亚马逊拟投资OpenAI 500亿美元助攻新版Alexa语音助理

2026-02-06 12:13

扫描全能王取消自动续费_扫描全能王会员自动扣费取消方法

2026-02-06 12:19

Google Pixel 10a定档2月18日或沿用Tensor G4处理器

2026-02-06 12:48

iOS 代码库泄露新款M5芯片代号包含M5 Max与M5 Ultra

2026-02-06 12:48

交互图标是什么？交互图标概念与使用说明

2026-02-06 13:34

战术RPG变身地牢闯关？《Shadowstone》2026 抢先体验

2026-02-06 13:41

ao3镜像入口是什么_ao3镜像入口怎么用啊

2026-02-06 13:48

扫描全能王怎么扫描成pdf_扫描全能王连续扫描转PDF教程

2026-02-06 14:09

ao3中文怎么设置_ao3怎么调成中文

2026-02-06 14:10

UPDATE FROM JOIN 在不同数据库的语法兼容写法

2026-02-06 16:22

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

857

2023.10.12