0

0

Linux高负载如何排查_从基础到进阶全流程讲透【教程】

冰川箭仙

冰川箭仙

发布时间:2025-12-24 22:53:10

|

840人浏览过

|

来源于php中文网

原创

linux高负载需结合load average与cpu核心数判断,load持续高于核心数表明过载,wa高或id低指向io瓶颈,再分cpu、io、内存三路排查并定位具体进程。

linux高负载如何排查_从基础到进阶全流程讲透【教程】

Linux高负载不是单看CPU使用率高就下结论,关键得看load averageCPU核心数的关系。比如8核机器,load长期高于8,才说明任务排队严重;若load是12但CPU idle还剩40%,大概率是IO卡住了,而不是算力不够。

一、先看整体:确认是不是真高负载

执行uptimetop,重点读这行:

load average: 9.59, 4.75, 1.92

三个值分别代表1/5/15分钟平均负载。对照CPU核心数判断:

  • load
  • load > CPU核心数 → 已过载,需排查
  • load远大于CPU核心数(如16核机器load=50)→ 严重排队,可能IO阻塞或进程失控

同时观察%Cpu(s)里的wa(IO等待)和id(空闲)。wa持续>20%或id接近0,基本可锁定IO瓶颈。

二、分方向排查:CPU高?还是IO高?还是内存压垮了?

根据top中waussy占比,走不同路径:

  • CPU高 + load高:用top -Hp [PID]找高耗线程,再printf "%x" [TID]转十六进制,最后jstack [PID] | grep -A 20 "0x..."定位Java热点代码;非Java进程可用perf top -p [PID]
  • CPU低 + load高:重点查IO。运行iostat -xz 1%util是否持续100%、await是否飙升;再用iotop直接看到底哪个进程在狂刷磁盘
  • 内存吃紧连带load高:跑free -h看available是否告急;vmstat 1里若si/so不为0,说明在疯狂swap;dmesg | grep oom查有没有被OOM killer干掉的进程

三、快速定位“搞事进程”:别只盯着top排序

除了top默认按CPU排序,还有更准的招:

  • 查IO大户:pidstat -d 1(每秒输出各进程读写KB)
  • 查网络连接数暴增:ss -s看total established是否异常高,再ss -tulnp | awk '{print $7}' | sort | uniq -c | sort -nr揪出监听端口最多的进程
  • 查打开文件过多:lsof -nPl | awk '{print $2}' | sort | uniq -c | sort -nr | head -10
  • 查内核级资源争用:slabtop看dentry/inode缓存是否暴涨,常因大量小文件操作引起

四、进阶收尾:避免重复踩坑

找到根因后,别只重启了事:

  • 如果是Java应用CPU高,用jstat -gcutil [PID] 1000看GC是否频繁;结合jmap -histo [PID]查对象堆积
  • 如果是磁盘IO高,检查调度器:cat /sys/block/sda/queue/scheduler,SSD建议用nonekyber,HDD可用deadline
  • 系统级调优可临时生效:echo 10 > /proc/sys/vm/swappiness降低swap倾向;ulimit -n 65535防文件句柄耗尽
  • 长期方案要考虑业务逻辑优化,比如把高频时间戳转字符串改成预计算缓存,避免单次请求做上万次重复转换

基本上就这些。排查讲究顺序:先看load和CPU关系,再分IO/CPU/内存三路并进,最后落到具体进程和代码。不复杂但容易忽略wa和r队列长度这两个关键信号。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

192

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

17

2026.02.03

sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

408

2023.09.04

printf用法大全
printf用法大全

php中文网为大家提供printf用法大全,以及其他printf函数的相关文章、相关下载资源以及各种相关课程,供大家免费下载体验。

76

2023.06.20

fprintf和printf的区别
fprintf和printf的区别

fprintf和printf的区别在于输出的目标不同,printf输出到标准输出流,而fprintf输出到指定的文件流。根据需要选择合适的函数来进行输出操作。更多关于fprintf和printf的相关文章详情请看本专题下面的文章。php中文网欢迎大家前来学习。

300

2023.11.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

718

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

219

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1561

2023.10.24

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

4

2026.03.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.2万人学习

Git 教程
Git 教程

共21课时 | 4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号