0

0

vmstat r 高但 cpu idle 高的 futex_wait / mutex 争用分析

舞夢輝影

舞夢輝影

发布时间:2026-01-30 16:45:09

|

864人浏览过

|

来源于php中文网

原创

r高但%idle高说明CPU不忙,瓶颈在futex/mutex等同步原语争用;可用perf record -e 'syscalls:sys_enter_futex'和pidstat -w验证,重点看用户进程调用栈是否含pthread_mutex_lock或__lll_lock_wait。

vmstat r 高但 cpu idle 高的 futex_wait / mutex 争用分析

vmstat 显示 r 高但 %idle 也高,说明什么?

这通常不是 CPU 真的忙,而是大量进程在就绪队列里“排队等锁”,还没轮到真正执行。r 是 run queue 长度(可运行但没拿到 CPU 的进程数),%idle 高说明 CPU 空闲时间多——矛盾点恰恰暴露了瓶颈不在 CPU 计算,而在同步原语上,比如 futex_waitmutex 争用。

怎么确认是 futex_wait / mutex 导致的阻塞?

perf record -e 'syscalls:sys_enter_futex' -a sleep 10 抓系统级 futex 调用热点;再结合 perf report --no-children 看哪些函数频繁陷入 sys_futex。如果看到大量调用pthread_mutex_lock__lll_lock_waitdo_futex,基本锁定是用户态 mutex/futex 争用。

  • 注意区分:内核线程的 futex_wait(如 kthreadd)一般无关,重点看用户进程的调用栈
  • pidstat -w 1 可辅助观察 cswch/s(自愿上下文切换)是否异常高——futex 等待会触发自愿切换
  • 若应用用的是 Go,runtime.futexsync.Mutex.lockSlow 出现在 perf 栈里,也属同类问题

常见诱因和快速验证点

不是所有 mutex 争用都显性报错,但以下场景极易引发高 r + 高 idle:

  • 多个线程反复抢同一把全局 pthread_mutex_t(尤其未设 PTHREAD_MUTEX_ADAPTIVE_NP 时)
  • Go 程序中对共享 map 无保护读写,触发 fatal error: concurrent map writes 前的隐性锁等待
  • C++ 应用用了 std::mutex 但临界区过长(比如含网络 I/O 或磁盘操作)
  • Java 应用中 synchronized 方法/块被高频调用,且锁对象是静态或单例

验证方法:临时改用 perf record -e 'sched:sched_switch' -a sleep 5,再 perf script | awk '$4=="R" && $9=="S"' | head -20 查看哪些进程常从 Running 变成 Sleeping —— 若频繁停在 futex_wait_queue_memutex_lock_common,就是它了。

为什么 top/htop 看不到这些线程的 CPU 占用?

因为它们大部分时间处于 S(interruptible sleep)状态,在内核的 futex 等待队列里挂起,不消耗 CPU 时间片,所以 %CPU 列很低,但 STAT 列会显示 D(uninterruptible)或更常见的 S + +(表示在等待某事件)。ps -eo pid,comm,wchan:20,state,pcpu | grep -E '(futex|mutex)' 能直接看到 wchan 列是否为 futex_wait_queue_memutex_lock

这类问题难在表象“不忙”,但实际吞吐掉队、延迟毛刺频发。真正要调的不是 CPU,而是锁粒度、争用路径和唤醒机制——比如把一把大锁拆成 per-bucket 锁,或改用无锁结构(如 ring buffer、RCU),而不是加核或升频。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

533

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

385

2023.10.25

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

448

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

606

2023.08.10

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

806

2023.08.10

golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

77

2025.09.05

golang map相关教程
golang map相关教程

本专题整合了golang map相关教程,阅读专题下面的文章了解更多详细内容。

41

2025.11.16

golang map原理
golang map原理

本专题整合了golang map相关内容,阅读专题下面的文章了解更多详细内容。

67

2025.11.17

Python WebSocket实时通信与异步服务开发实践
Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践,系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例,帮助开发者构建高效稳定的实时通信系统,适用于聊天应用、实时数据推送等场景。

7

2026.03.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.5万人学习

C# 教程
C# 教程

共94课时 | 11.6万人学习

Java 教程
Java 教程

共578课时 | 84.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号