
Linux 系统性能监控不靠猜,靠工具。选对工具、理解指标含义、结合场景看数据,才能快速定位 CPU、内存、磁盘、网络等瓶颈。
基础命令:实时查看系统负载
这些命令轻量、无需安装,适合快速排查:
- top / htop:动态显示进程级 CPU 和内存占用;htop 支持鼠标操作和颜色高亮,体验更友好(需 apt/yum 安装)
- vmstat 1:每秒输出一次虚拟内存、进程、CPU 活动统计;重点关注 r(运行队列长度) 和 si/so(swap 交换量)
- iostat -x 1:查看磁盘 I/O 详细指标;%util > 80% 且 await 显著升高,通常说明磁盘已成瓶颈
- netstat -s 或 ss -s:汇总网络协议栈统计,如重传数、连接失败数,辅助判断网络异常
进阶分析:定位资源争用与延迟问题
当基础命令不够细,需深入内核或追踪时使用:
基于PHP+MYSQL开发,具有完善的企业、信息、产品、文章发布和管理功能,灵活的会员权限控制和会员管理系统,灵活的可视化模版引擎,HTML静态页面生成和多语言支持,丰富的网站辅助工具,用于创建行业商贸信息网站、地方商贸信息门户网站。v5.1版本增加了多项功能,支持了PHP5+MYSQL5环境,前台网站插件开放源码,更利于个性化的商贸网站开发。主要功能模块:企业名录系统 - 企业介绍发布和企业名录
- pidstat -u -r -d 1:按进程维度同时采集 CPU、内存、I/O 使用率,比 top 更易横向对比
- perf top:实时采样 CPU 火焰图级热点函数(需 debuginfo 支持),适合排查应用层性能拐点
- tcpdump + wireshark:抓包分析网络延迟、重传、乱序;生产环境慎用,建议配合 -c 指定包数 或 -w 保存文件后离线分析
- bpftrace / bcc 工具集(如 opensnoop、biolatency):基于 eBPF 实现低开销内核跟踪,可观测文件打开、块设备延迟等传统工具难覆盖的路径
长期观测与告警:用时间序列守住基线
单次检查只能看“快照”,持续监控才能发现趋势和异常:
- sysstat(sar 命令):后台收集 CPU、内存、IO、网络等指标,默认保留 7 天;sar -u 1 5 查实时,sar -f /var/log/sa/saXX 查历史
- Prometheus + Node Exporter:主流开源组合;Node Exporter 暴露指标端点,Prometheus 抓取并存储,Grafana 可视化;适合容器化或混合环境
- zabbix / Nagios:传统企业级方案,自带告警策略和 Web 管理界面,部署稍重但集成度高
实用建议:少踩坑、快上手
监控不是堆工具,而是建立有效反馈链:
- 先明确目标:是查突发卡顿?还是做容量规划?不同目标对应不同工具粒度和保留周期
- 避免“全量采集”:高频采样(如 100ms 一次)会显著增加系统开销,尤其在高负载机器上
- 关注比率而非绝对值:比如 %iowait 高但 %idle 也高,说明 I/O 等待未挤占 CPU,未必是瓶颈
- 把监控和日志打通:当 CPU 突增时,同步查对应时段的应用日志或 journalctl -u xxx.service








