大量脏页堆积但 iostat %util 不高的 page cache 异步回写优化

冷炫風刃

发布时间：2026-02-07 14:19:02

611人浏览过

来源于php中文网

原创

脏页积压主因是vm.dirty_background_ratio过低导致回写过早且不畅，而非vm.dirty_ratio未达阈值；需同步调高background_ratio（15–25）、dirty_ratio（30–40），并缩短dirty_expire_centisecs（1000–1500）以均衡回写节奏。

大量脏页堆积但 iostat %util 不高的 page cache 异步回写优化

为什么 `vm.dirty_ratio` 调高了，脏页还是积压？

因为内核不会等脏页涨到 vm.dirty_ratio 才开始回写——它更早就会触发异步回写，而触发阈值由 vm.dirty_background_ratio 控制。如果这个值太低（比如默认 10），系统会频繁唤醒 pdflush（或现代内核的 writeback 线程），但线程本身可能被 I/O 延迟卡住、或受限于设备吞吐，导致脏页“产速＞写速”，越积越多。

常见错误现象：iostat -x 显示 %util 持续低于 30%，但 /proc/meminfo 中 Dirty: 和 Writeback: 居高不下，应用 write() 延迟升高。

vm.dirty_background_ratio 建议调至 15–25（视内存总量而定），避免过早、过碎的回写打断业务 IO
vm.dirty_ratio 可同步上调至 30–40，为突发写留出缓冲空间，但别超过 50，否则 sync() 或内存回收时容易卡死
必须配对调整 vm.dirty_background_bytes 和 vm.dirty_bytes（二者与 *_ratio 互斥），否则 ratio 设置会被忽略

`vm.dirty_expire_centisecs` 设太长，脏页就“赖着不走”

这个参数决定脏页在内存里最多“躺”多久才必须被回写（单位是厘秒，即 1/100 秒）。默认 3000（30 秒），看似宽松，但在高吞吐写场景下，大量脏页会在 30 秒内反复被标记为“可回写”，却因 writeback 线程调度或磁盘队列阻塞迟迟没发出，最终全部挤在 expire 临界点前集中冲刷，造成 I/O 尖峰。

使用场景：SSD 或 NVMe 后端、日志型写入（如 Kafka broker、数据库 WAL）、容器环境共享宿主机 page cache。

把 vm.dirty_expire_centisecs 从 3000 降到 1000–1500（10–15 秒），让回写节奏更均匀
注意：设太短（如
该值不影响已进入 Writeback: 状态的页，只约束“脏了但还没排队”的页

为什么 `iostat %util` 看着不高，磁盘其实已经饱和？

%util 是基于设备忙闲时间统计的，对 NVMe 或多队列 SCSI 设备意义很弱——它只看单个请求队列是否 busy，而现代存储能并行处理数百请求。实际瓶颈常在文件系统层（如 ext4 journal 锁）、块层调度器（cfq 已弃用，但 mq-deadline 的 deep queue 行为难预测），或 RAID 卡缓存策略上。

影谱

汉语电影AI辅助创作平台

下载

性能影响：%util 30% 时，await 可能已超 20ms，svctm 失真，avgqu-sz 持续大于 4 就说明队列深度压满。

优先看 iostat -x 1 的 avgqu-sz 和 await，而非 %util
确认存储栈：裸盘？LVM？mdadm？ZFS？不同层有各自的缓存和限流逻辑，page cache 回写会穿透所有层
用 perf record -e 'block:*' -a sleep 10 抓块层事件，看 block_bio_queue 是否堆积

容器或 KVM 里改 `vm.dirty_*` 参数没效果？

因为 cgroup v1 的 memory 子系统默认不隔离 page cache 脏页控制参数；cgroup v2 虽支持 memory.pressure，但 vm.dirty_* 仍是全局 sysctl，容器内修改只作用于自身命名空间，宿主机内核仍按原值调度 writeback 线程。

兼容性影响：Kubernetes Pod 的 securityContext.sysctls 只允许 fs.*、net.* 等白名单，vm.* 默认禁止写入，强行加会启动失败。

必须在宿主机层面统一调优，容器内仅可通过 sync()、fsync() 主动干预，或挂载 noatime,nobarrier 减少元数据写压力
若用 systemd-run 启动服务，可用 --scope --property=MemoryLimit=... 配合 vm.swappiness=1 间接减少脏页生成
云厂商自研存储（如阿里云 ESSD、AWS io2）通常关闭 host 端 writeback，依赖实例内应用直写，此时调 vm.dirty_* 完全无效

最易被忽略的一点：脏页堆积未必是回写慢，也可能是应用持续 write() + mmap(MAP_SHARED) 修改，且没调 msync()，导致 page cache 脏页生命周期完全脱离内核 writeback 控制节奏。

SQL 如何用 NOT EXISTS 实现“差集”查询（A-B）

SQL 如何用 PERCENTILE_CONT / PERCENTILE_DISC 计算精确中位数

MySQL GROUP BY 隐式排序被移除后如何强制排序不影响性能

LEFT JOIN + IS NULL 如何实现 NOT IN 的替代写法

PostgreSQL array_agg 与 string_agg 的排序与去重写法

相关标签:

app 后端阿里云栈 ai ios pdf kubernetes 为什么 red sql kafka 命名空间栈堆 Property 线程事件异步数据库 kubernetes

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：swappiness=10 后仍频繁 swap 的 anon page / file-backed page 区分排查下一篇：暂无

作者最新文章

扫描王电脑版官方下载_扫描全能王电脑网页版官方入口指南

2026-02-06 11:42

github官网网址怎么找 github官网怎么进入

2026-02-06 11:47

截图秒变连结、注记行事曆库克钦点「视觉智慧」成苹果AI人气王

2026-02-06 12:45

4月有大动作！库克预告苹果50周年庆典

2026-02-06 13:14

漫蛙漫画网页入口防走丢漫蛙漫画网页官方入口免费阅读

2026-02-06 13:49

漫蛙漫画在线登录入口免费进漫蛙漫画manwatw

2026-02-06 13:56

漫蛙漫画网页入口防走丢漫蛙漫画2026最新链接入口

2026-02-06 14:03

initramfs 重建后仍卡在 "waiting for root device" 的 UUID / LABEL 检查

2026-02-06 14:17

性能旗舰新标杆！iQOO 15 Ultra 4999 元起，满帧体验 + 全能配置双在线

2026-02-06 15:26

Python 流式处理网络数据的正确方式

2026-02-06 16:00

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

856

2023.10.12