rcu detected stall 的 rcu_sched / rcu_bh 超时调优参数

冷漠man

发布时间：2026-01-29 18:32:04

197人浏览过

来源于php中文网

原创

rcu_sched stall超时由RCU_STALL_DELAY_DELTA和rcu_cpu_stall_timeout控制，后者默认21秒且可通过sysctl动态调整；rcu_bh stall共享该参数但实际判定窗口更短，无独立调控接口。

rcu detected stall 的 rcu_sched / rcu_bh 超时调优参数

rcu_sched stall 超时时间由哪些参数控制

内核中 rcu_sched stall 检测的超时阈值不是固定值，而是基于 CPU tick 频率和预设的“stall timeout 倍数”动态计算。核心控制参数是 RCU_STALL_DELAY_DELTA（编译期常量）和运行时可调的 rcu_cpu_stall_timeout，后者默认为 21 秒（即 21 * HZ / 1000 毫秒级 tick 对齐）。该值可通过 sysctl 修改：

echo 30 > /proc/sys/kernel/rcu_cpu_stall_timeout —— 将 stall 报告阈值设为 30 秒
该修改仅影响新触发的 stall 检测，已发生的 stall 不会重置计时器
需确保内核配置了 CONFIG_RCU_CPU_STALL_INFO=y，否则该 sysctl 不存在

rcu_bh stall 和 rcu_sched 的 timeout 是否共用参数

不共用。rcu_bh stall 的检测逻辑与 rcu_sched 独立，但共享同一套超时机制：它也读取 rcu_cpu_stall_timeout，但实际生效的 stall 判定窗口更短——因为 rcu_bh 的 grace period 通常极短（微秒级），其 stall 检测在内部会按比例压缩等待时间。关键点：

rcu_bh stall 不受独立 sysctl 控制；没有类似 rcu_bh_stall_timeout 的接口
若看到 rcu_bh stall 日志，往往意味着 softirq 处理被长时间阻塞（如驱动在 softirq 中死循环、关中断过久）
不能靠调大 rcu_cpu_stall_timeout 来掩盖 rcu_bh stall，这只会延迟报警，不解决根本问题

调大 rcu_cpu_stall_timeout 能解决假阳性吗

能缓解部分场景，但有明确边界。常见适用情况包括：

系统启用了 nohz_full（无滴答模式）且某个 CPU 长时间运行独占线程，导致 RCU callback 积压
内核调试配置（如 CONFIG_PROVE_RCU 或锁依赖检查）显著拖慢 grace period 完成
极端负载下（如大量进程 fork/exit + RCU callback 爆发），callback 处理队列延迟超过默认 21 秒

但以下情况调大参数无效甚至有害：

快写红薯通AI

快写红薯通AI，专为小红书而生的AI写作工具

下载

真实 lockup（如自旋锁死锁、中断被禁用超 1s）—— stall 是症状，不是原因
RCU callback 中执行耗时操作（如 kmalloc + disk I/O）——应改用 workqueue 异步处理
误将 call_rcu() 用于短生命周期对象，导致 callback 队列膨胀

真正需要检查的底层线索

stall 日志末尾的 backtrace 和 CPU state 才是关键。重点关注：

报 stall 的 CPU 当前是否在 __do_softirq、rcu_core 或某驱动函数中停滞？—— 指向 softirq 或 callback 实现问题
是否显示 rcu_preempt 同时 stall？—— 可能是 PREEMPT_RT 补丁行为异常或抢占被意外关闭
rcu_sched stall 时，对应 CPU 的 jiffies 是否几乎不动？—— 暗示该 CPU 已完全 hang 住，而非 RCU 本身慢
/proc/sys/kernel/rcu_expedited 若为 1，可能因频繁强制 expedited GP 导致 overload

RCU stall 不是性能调优项，而是系统健康探针。参数调整只是临时掩耳盗铃，真正要盯的是 stall 发生时那个 CPU 正在干什么。

相关标签:

echo 常量循环接口线程对象异步

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python 并发程序中的常见坑点下一篇：Python 编写可维护 CLI 工具的实践经验

作者最新文章

Linux进程五种状态转换原理及R与D状态性能影响分析

2026-03-14 12:24

Linux系统中线程Thread与轻量级进程LWP内在联系分析

2026-03-14 12:41

MacOS系统针对外部存储的Spotlight索引禁用设置

2026-03-14 13:02

Windows运维中利用GPO配置无线网络配置文件自动连接

2026-03-14 13:14

Java中Apache缓存雪崩现象的预防与后端保护逻辑

2026-03-14 13:22

Linux系统卡死问题_内核日志分析

2026-03-14 13:34

Linux 大促场景性能优化_削峰填谷策略

2026-03-14 13:43

Linux日志切割配置_logrotate实践

2026-03-14 13:53

SQLSQL注入防护_输入校验与参数化查询

2026-03-14 14:02

SQL批量删除优化_DELETE与TRUNCATE对比

2026-03-14 14:51

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1570

2023.10.24

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

2009

2023.10.19