Linux 负载高但 CPU 空闲的常见原因

冷漠man

发布时间：2026-01-29 17:08:36

183人浏览过

来源于php中文网

原创

负载高但CPU空闲是因为大量进程处于D状态（不可中断睡眠），它们不占CPU却计入load average；主因是I/O阻塞（如慢盘、NFS hard挂载、驱动异常）或内存直接回收。

linux 负载高但 cpu 空闲的常见原因

为什么 `top` 显示 CPU 使用率低，但 `load average` 却很高

负载高但 CPU 空闲，本质是系统中有大量进程处于 uninterruptible sleep（D 状态），它们不消耗 CPU，却会计入负载。Linux 的 load average 统计的是「平均等待运行或等待 I/O 完成的进程数」，不是 CPU 使用率。

常见诱因包括：

磁盘 I/O 严重阻塞（如慢盘、RAID 同步、LVM 快照刷新）
网络存储挂载异常（NFS/CIFS 连接卡在 hard mount 状态）
内核模块或驱动陷入不可中断等待（如某些加密模块、老旧 RAID 卡固件）
内存严重不足触发直接回收（direct reclaim），导致进程在 __alloc_pages_slowpath 中 D 等待

如何快速定位 D 状态进程和源头设备

先用 ps 找出 D 状态进程：

ps -eo pid,stat,comm,wchan:30 --sort=-pcpu | head -20

重点关注 STAT 列含 D 的行，以及 WCHAN 列（等待的内核函数名）。常见高危 wchan 包括：io_schedule、nvme_queue_rq、__wait_on_bit、nfs_wait_event。

再查 I/O 压力来源：

iostat -x 1：看 %util 是否持续 100%，await 和 r_await/w_await 是否异常高（>100ms）
cat /proc/diskstats：对比 io_ticks 增长速率，确认是否某块盘长期忙
lsof +D /mnt/nfs_share（若怀疑 NFS）：看哪些进程卡在该挂载点

NFS hard mount 卡死是高频原因，怎么验证和缓解

NFS hard 挂载下服务端宕机或网络中断时，客户端进程会永久 D 等待，直到服务器恢复——这期间 load 会飙升，top 却看不到 CPU 消耗。

iMuse.AI

iMuse.AI 创意助理，为设计师提供无限灵感！

下载

验证方法：

find /mnt/nfs -maxdepth 1 -name "*" 2>/dev/null | head -5：如果卡住不动，大概率是 NFS hang
mount | grep nfs：检查是否用了 hard,intr（intr 已被废弃，现代内核忽略它）
rpcinfo -p $nfs_server：确认服务端 NFS daemon 是否响应

临时缓解（不重启）：

对已 hang 的挂载点，尝试 umount -f /mnt/nfs（强制卸载，可能失败）
更可靠的是加 soft + timeo 重挂（仅限可容忍数据丢失的场景）：mount -t nfs -o soft,timeo=10,retrans=3 server:/export /mnt/nfs

内核参数和日志里藏着关键线索

dmesg -T 往往有直接证据，比如：

INFO: task rsync:12345 blocked for more than 120 seconds. 后跟调用栈，常指向 NVMe 超时或 ext4 journal 等待
blk_update_request: I/O error, dev nvme0n1, sector 123456789 表示硬件/固件层故障
nfsv4: server not responding, timed out 直接锁定 NFS 问题

关键内核参数影响 D 状态持续时间：

/proc/sys/vm/swappiness 过高（如 >80）可能加剧 direct reclaim，诱发 D 等待
/proc/sys/vm/vfs_cache_pressure 异常低（
某些云环境需检查 /sys/block/*/device/timeout（如 NVMe 的 nvmf 超时值是否被设为 0）

真正难排查的，往往是多个小 I/O 请求叠加导致的设备队列饱和，而非单一大文件拷贝。这时候 iostat -x 的 avgqu-sz（平均队列长度）比 %util 更能说明问题——即使 %util 只有 70%，但 avgqu-sz > 32，就代表请求已在排队，后续进程开始 D 等待。

针对Linux服务器高并发Socket句柄数限制的修改与生效

Linux服务日志在哪看_服务日志定位技巧

Linux环境下利用MTR工具综合分析网络延迟与路由损耗

Linux监控指标不准问题_采集误差分析

Linux磁盘IO很慢怎么办_IO性能分析方法

相关标签:

linux 栈 ai ios 数据丢失 NULL for Error 栈 linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux 系统资源突然耗尽的预警信号下一篇：Linux 磁盘空间告急时的应急处理策略

作者最新文章

Linux进程五种状态转换原理及R与D状态性能影响分析

2026-03-14 12:24

Linux系统中线程Thread与轻量级进程LWP内在联系分析

2026-03-14 12:41

MacOS系统针对外部存储的Spotlight索引禁用设置

2026-03-14 13:02

Windows运维中利用GPO配置无线网络配置文件自动连接

2026-03-14 13:14

Java中Apache缓存雪崩现象的预防与后端保护逻辑

2026-03-14 13:22

Linux系统卡死问题_内核日志分析

2026-03-14 13:34

Linux 大促场景性能优化_削峰填谷策略

2026-03-14 13:43

Linux日志切割配置_logrotate实践

2026-03-14 13:53

SQLSQL注入防护_输入校验与参数化查询

2026-03-14 14:02

SQL批量删除优化_DELETE与TRUNCATE对比

2026-03-14 14:51

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

1132

2024.03.01

scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

513

2023.10.18

500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

384

2023.10.25

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

448

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

606

2023.08.10

磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制，就是管理员可以为用户所能使用的磁盘空间进行配额限制，每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容，教程，供大家免费下载安装。

1564

2023.06.21

如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章，还有相关的下载、课程，大家可以免费体验。

716

2023.06.29

C++多线程并发控制与线程安全设计实践

本专题围绕 C++ 在高性能系统开发中的并发控制技术展开，系统讲解多线程编程模型与线程安全设计方法。内容包括互斥锁、读写锁、条件变量、原子操作以及线程池实现机制，同时结合实际案例分析并发竞争、死锁避免与性能优化策略。通过实践讲解，帮助开发者掌握构建稳定高效并发系统的关键技术。

2026.03.16

热门下载

网站特效

网站源码

网站素材

前端模板

Linux 负载高但 CPU 空闲的常见原因

为什么 top 显示 CPU 使用率低，但 load average 却很高

如何快速定位 D 状态进程和源头设备

NFS hard mount 卡死是高频原因，怎么验证和缓解

内核参数和日志里藏着关键线索

为什么 `top` 显示 CPU 使用率低，但 `load average` 却很高