0

0

LinuxCPU软中断过高_CPU软中断排查方法

冰川箭仙

冰川箭仙

发布时间:2026-03-05 09:51:12

|

282人浏览过

|

来源于php中文网

原创

linuxcpu软中断过高_cpu软中断排查方法

软中断(softirq)过高,典型表现是 top%si 持续超过 10%~15%,而系统负载(load average)不高、用户态和内核态 CPU 使用率(%us/%sy)却明显偏低。这说明 CPU 时间正被内核后台中断处理大量占用,不是业务逻辑在跑,而是网络收包、定时器或调度任务在“卡住”CPU。

看 /proc/softirqs 定位主因类型

软中断种类多,但真正影响性能的通常只有三类:

  • NET_RX:网络数据包接收软中断。飙升说明网卡收包压力大,常见于高并发短连接、SYN Flood、UDP 风暴等场景
  • TIMER:内核定时器软中断。异常升高可能源于大量 hrtimer 或 RCU 回调堆积,比如某些驱动或模块频繁注册微秒级定时器
  • SCHED:调度器软中断。持续偏高往往指向进程调度过于频繁,如大量短生命周期线程、cgroup 频繁限频触发重调度

执行 cat /proc/softirqs,重点对比各 CPU 列中这三列数值。若某 CPU 的 NET_RX 值比其他核高出一个数量级(例如 500 万 vs 5 万),说明软中断严重不均衡,大概率是硬中断绑定单一 CPU 导致的“单核瓶颈”。

查硬中断分布与网卡队列配置

软中断不均,根源常在硬中断绑定和网卡多队列策略错配:

TicNote
TicNote

出门问问推出的Agent AI智能硬件

下载
  • cat /proc/interrupts | grep eth0 查看各 CPU 上 eth0 相关硬中断次数,确认是否集中在 0 号核
  • 运行 cat /sys/class/net/eth0/device/msi_irqs/* 确认网卡支持的 MSI-X 向量数(即硬件队列数),应与 CPU 核数匹配
  • 检查 cat /proc/sys/net/core/rps_cpu_mask 是否为空:为空表示 RPS(Receive Packet Steering)关闭,软中断无法跨核分发,必须开启

RPS、RSS、XPS 配置不一致时,容易触发 soft lockup 日志(dmesg | grep watchdog),此时仅调参数无效,需统一规划队列映射关系。

调参要讲配合,不能只改 netdev_budget

net.core.netdev_budget 控制每次软中断上下文最多处理多少个包,默认 300。盲目调大(如设为 600)反而更卡:

  • 它会让 net_rx_action 占用单次软中断时间过长,阻塞其他关键任务(如实时线程、调度器)
  • 合理值参考:千兆网卡建议 60–120,万兆网卡 120–240
  • 必须同步调整:net.core.netdev_max_backlog(建议 ≥5000),并确保 RPS 已启用,否则只是把丢包压力转成延迟压力

交叉验证是否真由软中断拖慢业务

仅看 %si 高不够,要确认它是否实际打断了业务线程:

  • 运行 perf record -e 'syscalls:sys_enter_nanosleep,irq:softirq_entry' -C 0 -g -- sleep 10
  • 再执行 perf script | grep -E '(net_rx|nanosleep)'
  • 若大量 nanosleep 调用被 net_rx_action 中断打断,且堆栈显示在 __do_softirq 中单次耗时超 1ms,才可判定软中断是直接诱因

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

433

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

600

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

433

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

600

2023.08.10

class在c语言中的意思
class在c语言中的意思

在C语言中,"class" 是一个关键字,用于定义一个类。想了解更多class的相关内容,可以阅读本专题下面的文章。

768

2024.01.03

python中class的含义
python中class的含义

本专题整合了python中class的相关内容,阅读专题下面的文章了解更多详细内容。

25

2025.12.06

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

743

2023.08.10

tcp和udp的区别
tcp和udp的区别

TCP和UDP的区别,在连接性、可靠性、速度和效率、数据报大小以及适用场景等方面。本专题为大家提供tcp和udp的区别的相关的文章、下载、课程内容,供大家免费下载体验。

124

2023.07.25

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

32

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.1万人学习

Git 教程
Git 教程

共21课时 | 4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号