0

0

ksoftirqd 长期占用 20~40% 的 softnet backlog 调优与网卡参数

舞夢輝影

舞夢輝影

发布时间:2026-01-19 17:55:02

|

260人浏览过

|

来源于php中文网

原创

ksoftirqd高CPU占用本质是网卡收包速率超协议栈处理能力,需通过多队列、中断亲和、调优netdev_budget等降低softnet backlog。

ksoftirqd 长期占用 20~40% 的 softnet backlog 调优与网卡参数

ksoftirqd 占用高 CPU(20~40%)且伴随 sof.net backlog 持续堆积,本质是内核软中断处理网络收包不及时,不是 ksoftirqd 本身有问题,而是它在“拼命干活”——说明网卡收包速率超过了协议处理能力。调优核心是:**让硬件收得更稳、内核处理得更快、队列堆积得更少**。

检查并确认瓶颈来源

先排除误判:

  • 运行 cat /proc/net/softnet_stat,逐列看每 CPU 的第 1 列(processed)、第 2 列(dropped)、第 3 列(time_squeeze)。若某 CPU 的 time_squeeze 长期增长快,说明该 CPU 软中断处理不过来;dropped 非零则已丢包。
  • perf top -g -p $(pgrep ksoftirqd)热点函数,常见如 napi_poll__netif_receive_skb_coreip_rcv,确认是否卡在协议栈上层(如 iptables、conntrack)或底层驱动。
  • 检查是否单队列网卡绑定到单个 CPU,导致负载不均。执行 ethtool -l ethX 查看当前通道数,cat /proc/interrupts | grep ethX 看中断分布是否集中。

网卡多队列与中断亲和性调优

让多个 CPU 分担收包压力,避免单核瓶颈:

  • 启用多队列:ethtool -L ethX combined N(N 通常设为 CPU 核心数或略少),再确认 ethtool -l ethX 显示 rx/tx 队列已生效。
  • 绑定每个 RX 队列中断到不同 CPU:echo "CPU_MASK" > /proc/irq/IRQ_NUM/smp_affinity_list,建议按 NUMA 节点分组,例如 CPU 0-3 绑定队列 0-3,CPU 4-7 绑定队列 4-7。
  • 开启 RPS(软件层面补充负载均衡):对非多队列网卡或需要跨 CPU 分流时有效。echo "FF" > /sys/class/net/ethX/queues/rx-0/rps_cpus(十六进制掩码表示 CPU 位图)。

调整内核网络参数降低 backlog 压力

控制入队节奏与处理深度,防止 softnet backlog 溢出:

百度MCP广场
百度MCP广场

探索海量可用的MCP Servers

下载
  • 增大 per-CPU softnet backlog 队列长度(默认 1000):sysctl -w net.core.netdev_max_backlog=5000。注意过高会增加延迟,5000~10000 是较安全起点。
  • 限制单次软中断处理的包数,避免长时间占用 CPU:sysctl -w net.core.netdev_budget=300(默认 300,可尝试 150~600 区间,需实测平衡吞吐与 latency)。
  • 关闭可能拖慢收包路径的功能:如非必要,禁用 net.bridge.bridge-nf-call-iptables=0net.ipv4.conf.all.rp_filter=0(仅限可信内网)。

驱动与固件层面优化

很多问题根源在驱动或硬件配置:

  • 升级网卡驱动和固件(尤其是 Intel ixgbe、i40e、mlx5 等),旧版本存在 NAPI 调度缺陷或队列唤醒延迟。
  • 关闭 LRO/GRO(巨型帧重组):ethtool -K ethX lro off gro off。GRO 在高并发小包场景下反而加剧 softirq 压力,建议只开 GSO(发送端)。
  • 调整 Ring Buffer 大小:ethtool -G ethX rx 4096 tx 4096(根据内存和流量特征调,避免过小溢出、过大增缓存压力)。

调优后持续观察 /proc/net/softnet_stattop 中 ksoftirqd 的 CPU 使用率变化,重点看 time_squeeze 是否收敛、dropped 是否归零。多数情况下,合理设置多队列 + 中断亲和 + netdev_budget 控制,即可将 ksoftirqd 占用压至 5% 以下。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

class在c语言中的意思
class在c语言中的意思

在C语言中,"class" 是一个关键字,用于定义一个类。想了解更多class的相关内容,可以阅读本专题下面的文章。

465

2024.01.03

python中class的含义
python中class的含义

本专题整合了python中class的相关内容,阅读专题下面的文章了解更多详细内容。

13

2025.12.06

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

11

2026.01.19

微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

73

2026.01.18

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

108

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1.0万人学习

进程与SOCKET
进程与SOCKET

共6课时 | 0.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号