
pidstat 是 sysstat 工具包中的一个轻量级实时监控命令,专用于按进程(PID)维度统计 CPU、内存、I/O、上下文切换等资源使用情况。相比 top 或 htop,它更适配脚本化分析和细粒度排查——尤其当你需要定位“哪个线程在吃 CPU”“哪个进程在频繁刷盘”或“谁触发了大量软中断”时。
CPU 使用分析:识别高负载进程与线程
默认运行 pidstat 会每秒输出一次所有活跃进程的 CPU 占用(%CPU),并自动合并同一进程的多线程数据。加 -t 可展开线程级视图,显示线程 ID(TID)和父进程 ID(PID):
-
pidstat -t 1 5:每秒采样一次,共 5 次,带线程明细 - 重点关注
%usr(用户态 CPU)、%sys(内核态 CPU)和%guest(虚拟机开销)。若 %sys 显著偏高,可能涉及频繁系统调用或锁竞争 - 对 Java 进程,常看到多个
java线程 TID 并列高 %usr;此时可结合jstack <pid></pid>查看对应线程栈
I/O 行为追踪:发现隐性磁盘压力源
加 -d 参数启用 I/O 统计,输出每秒读写字节数(kB_rd/s、kB_wr/s)、IO 等待时间(%iowait)及每秒 I/O 操作数(tps):
自定义设置的程度更高可以满足大部分中小型企业的建站需求,同时修正了上一版中发现的BUG,优化了核心的代码占用的服务器资源更少,执行速度比上一版更快 主要的特色功能如下: 1)特色的菜单设置功能,菜单设置分为顶部菜单和底部菜单,每一项都可以进行更名、选择是否隐 藏,排序等。 2)增加企业基本信息设置功能,输入的企业信息可以在网页底部的醒目位置看到。 3)增加了在线编辑功能,输入产品信息,企业介绍等栏
-
pidstat -d -p <pid> 2</pid>:仅监控指定进程,每 2 秒刷新一次,适合聚焦分析 - 注意
MB_wr/s高但tps低 → 大块顺序写;反之tps高而kB_wr/s低 → 小块随机写,更易引发 I/O 瓶颈 - 若某进程 %iowait 持续 >20%,且磁盘 util 接近 100%(可用 iostat 验证),说明它正被 I/O 阻塞,而非主动消耗 CPU
内存与上下文切换:排查抖动与争用
用 -r 查看内存页错误(minflt:次要缺页,通常从 page cache 加载;majflt:主要缺页,需磁盘 IO)、驻留内存(RSS);用 -w 监控进程级上下文切换(cswch/s:自愿切换,如 sleep;nvcswch/s:非自愿切换,因时间片耗尽或资源争抢):
-
pidstat -r -w -p <pid> 1</pid>:同步观察内存缺页与切换行为 - 持续高
majflt/s通常指向内存不足或进程工作集远超物理内存 → 触发 swap 或 OOM killer - 非自愿切换(nvcswch/s)突增,配合高 %sys,往往意味着锁竞争(如 futex 等待)或 CPU 资源严重不足
实用技巧与避坑提醒
pidstat 默认只显示“活跃”进程(有资源消耗才出现),静默进程不会列出。想捕获启动瞬间的行为,可用 -l 显示完整命令行,或搭配 pgrep 动态过滤:
-
pidstat -u -p "$(pgrep -f 'python.*data_process.py')" 1:精准监控特定 Python 脚本 - 历史数据需用
sadf解析 sysstat 的二进制日志(/var/log/sa/saXX),pidstat 本身不落盘 - 容器环境中,宿主机 pidstat 看到的是容器内 PID(命名空间隔离后),需确认是否需进入容器 namespace 才能匹配应用日志中的 PID









