Linux 磁盘延迟高_延迟来源排查

冷炫風刃

发布时间：2026-03-06 01:15:27

304人浏览过

来源于php中文网

原创

linux 磁盘延迟高_延迟来源排查

Linux 磁盘延迟高，通常不是单一原因导致的，而是 I/O 路径中多个环节叠加的结果。排查时需从应用层、文件系统层、块设备层到物理磁盘逐层下钻，避免直接跳到硬件结论。

看懂 iostat 输出里的关键指标

iostat -x 1 是最常用的初步诊断命令，重点关注以下几列：

await：I/O 请求在队列中等待 + 实际服务的平均时间（毫秒），持续 > 10ms 需警惕；
r_await / w_await：分别表示读/写请求的平均响应时间，可判断是读密集还是写密集导致延迟；
%util：设备忙于处理 I/O 的时间百分比，接近 100% 说明设备饱和，但 SSD 场景下该值参考价值下降；
avgqu-sz：平均队列长度，持续大于 1 表示请求开始堆积；
svctm（已弃用，内核 2.6.38+ 不再准确）：不要依赖此项，以 await 为准。

定位是“真慢”还是“假堵”

磁盘延迟高 ≠ 磁盘本身故障。常见干扰因素包括：

GPTPLUS

GPTPLUS, 由GPT-4和GPT-3.5支持，为您的写作、翻译、代码分析和问答需求提供最准确、有效的AI反馈。

下载

脏页回写压力：大量 write() 后未及时 sync，触发内核集中 flush（查看 /proc/vmstat 中 pgpgout、pgmajfault 及 bdi 相关统计）；
I/O 调度器不匹配：CFQ 在 SSD 上反而拖慢性能，建议 NVMe 用 none，SATA SSD 用 deadline 或 mq-deadline；
文件系统日志模式：ext4 默认 data=ordered，大文件写入可能阻塞；journal 模式下元数据写入也会串行化；
透明大页（THP）+ 内存回收：在高 I/O 场景下触发 compaction 或 direct reclaim，间接拉高 I/O 延迟（检查 /proc/vmstat 中 pgmajfault、pgpgin）。

深入追踪具体进程和 I/O 模式

用更细粒度工具确认谁在发什么请求：

pidstat -d 1：按进程维度看每秒读写字节数、I/O 等待时间（%iowait）；
iotop -o：实时观察哪些进程正在做实际 I/O（-o 只显示有 I/O 的进程）；
bpftrace 或 biosnoop（bpftrace -e 'kprobe:blk_mq_start_request { printf("pid=%d cmd=%s\n", pid, args->rq->__cmd[0]) }'）：抓取单个 I/O 请求的发起者和命令类型（如 READ/WRITE/FUA）；
cat /sys/block/*/queue/scheduler 和 /sys/block/*/rotational：确认调度器是否生效、内核是否正确识别 SSD（rotational=0）。

检查底层硬件与驱动状态

排除软件层问题后，再查硬件相关线索：

smartctl -a /dev/sdX：关注 Reallocated_Sector_Ct、Current_Pending_Sector、UDMA_CRC_Error_Count；
dmesg | grep -i "ata\|nvme\|error\|timeout"：查找链路层错误、重试、link reset 等；
lsblk -d -o NAME,ROTA,RAND,LOG-SEC,PHY-SEC：确认逻辑/物理扇区大小是否对齐（尤其虚拟机或 LVM 场景）；
检查 RAID 卡缓存策略：WriteBack 未配 BBU 或电池失效时，控制器会自动降级为 WriteThrough，性能暴跌；用 MegaCli 或 storcli 查看 Cache Policy 和 BBU 状态。

Linux OOM Killer 的触发机制与 oom_score_adj 调优最佳实践

Linux服务器响应慢_系统性能全链路排查流程

Linux监控指标不准_指标含义与修正方法

Linux运维文档体系_文档结构设计

Linux 修改软件源提升下载速度

相关标签:

linux Error printf 堆 linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux DNS 解析失败问题解决下一篇：暂无

作者最新文章

PHP 数组基础使用中的易错点汇总

2026-03-05 13:30

Python常见面试题汇总_高频考点解析

2026-03-05 13:53

微信群消息发错了撤不回怎么办消息超时补救技巧

2026-03-05 14:01

MySQL 联合索引失效面试分析

2026-03-05 14:07

SQL 正则表达式在 SQL 数据处理实战应用

2026-03-05 14:50

Linux 开放端口与关闭端口方法

2026-03-05 14:57

手机淘宝菜鸟驿站代收怎么操作？怎么开菜鸟驿站代收点

2026-03-05 15:01

手机淘宝比价工具有哪些？手机淘宝比价工具有哪些软件

2026-03-05 15:06

Linux which 与 whereis 区别解析

2026-03-05 15:12

Linux软件安装失败排查_依赖冲突解决方案

2026-03-05 15:13

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

431

2023.10.18

500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

373

2023.10.25

printf用法大全

php中文网为大家提供printf用法大全，以及其他printf函数的相关文章、相关下载资源以及各种相关课程，供大家免费下载体验。

2023.06.20

fprintf和printf的区别

fprintf和printf的区别在于输出的目标不同，printf输出到标准输出流，而fprintf输出到指定的文件流。根据需要选择合适的函数来进行输出操作。更多关于fprintf和printf的相关文章详情请看本专题下面的文章。php中文网欢迎大家前来学习。

300

2023.11.28

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

434

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

600

2023.08.10

磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制，就是管理员可以为用户所能使用的磁盘空间进行配额限制，每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容，教程，供大家免费下载安装。

1542

2023.06.21

如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章，还有相关的下载、课程，大家可以免费体验。

716

2023.06.29

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

2026.03.05

热门下载

网站特效

网站源码

网站素材

前端模板