0

0

Linux 网卡丢包的常见硬件与软件原因

舞姬之光

舞姬之光

发布时间:2026-02-05 18:00:14

|

373人浏览过

|

来源于php中文网

原创

网卡丢包主因有四:物理层异常(Link/Speed/Duplex不匹配致silent丢包)、Ring Buffer溢出(RX-OVR飙升)、内核软中断瓶颈(RX-DRP与softnet_stat第2列同步涨)、tc/qdisc人为丢包(/proc/net/dev清零但业务异常)。

linux 网卡丢包的常见硬件与软件原因

网卡物理层异常:Link、Speed、Duplex 不匹配

丢包还没进内核,就已经被网卡硬件 silently 吃掉了。最常见的是光模块衰减过大、网线接触不良、两端协商失败——比如一端强制 1G 全双工,另一端 auto-negotiation 失败后降成 100M 半双工,结果 CRC 错误(RX-ERR)飙升。
立刻执行 ethtool eth0,盯死三行:Link detected: yes(否=物理断连)、Speed:(是否与对端一致)、Duplex:(必须是 Full)。若显示 Auto-negotiation: offfailed,别硬扛,换线、重启交换机端口,或统一手动设速:ethtool -s eth0 speed 1000 duplex full

Ring Buffer 溢出:RX-OVR 持续上涨

RX-OVR(即 rx_over_errors)不是内核丢的,是网卡 DMA 写不进 Ring Buffer 被硬件直接丢弃的包——tcpdump 在 eth0 都抓不到,因为压根没进内存。
查当前大小:ethtool -g eth0;典型值是 256/512,高吞吐场景下极易溢出。临时调大:ethtool -G eth0 rx 4096(注意部分驱动不支持热调,需确认 ethtool -i eth0 中 firmware 版本兼容性)。
同时检查驱动级计数器:ethtool -S eth0 | grep -i "fifo\|over\|buffer",重点看 rx_no_buffer_count 是否非零——有值就坐实是 Ring Buffer 不够用。

内核软中断瓶颈:RX-DRP + softnet_stat 第2列同步涨

RX-DRP 是包已进 Ring Buffer,但内核来不及取走,最终在 softnet 队列里被丢。常见于单核 CPU 被网卡中断打满、NAPI 轮询延迟高、或 net.core.netdev_max_backlog 过小。
先看中断分布:cat /proc/interrupts | grep eth0,若所有 IR-PCI-MSI 都集中在 CPU0,说明没做 IRQ affinity;再看软中断压力:watch -n1 'cat /proc/net/softnet_stat | head -1 | awk "{print \$1,\$2}"',第2列(dropped)持续非零,就是 softnet 队列溢出证据。
可启用 RPS 分散负载:echo f > /sys/class/net/eth0/queues/rx-0/rps_cpusf 表示前4核),并调大 backlog:sysctl -w net.core.netdev_max_backlog=5000

tc/qdisc 人为丢包:网卡统计清白,但实际丢得明明白白

这是最隐蔽的“伪硬件丢包”——/proc/net/devRX-DRP/RX-OVR 全为 0,但业务就是连不上、重传率高。原因往往是 tc 配了 netem loss 或限速策略,丢包发生在协议之前,完全绕过网卡计数器。
务必运行:tc qdisc show dev eth0tc -s qdisc show dev eth0(带 -s 才能看到真实 dropped 数);若输出含 loss 5%limit 1000policer 字样,立刻确认是否误配。清除命令是:tc qdisc del dev eth0 root,但注意:容器网络(如 CNI)可能在 host 网卡上挂规则,别只查 eth0,也得查 cni0flannel.1 等。

真正难排查的丢包,往往卡在「硬件没报错、内核没记录、tc 又没想起来查」这三不管地带。Ring Buffer 设置、中断亲和性、tc 规则——这三个点,80% 的线上丢包问题都绕不开。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

187

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

4

2026.02.03

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

400

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

579

2023.08.10

class在c语言中的意思
class在c语言中的意思

在C语言中,"class" 是一个关键字,用于定义一个类。想了解更多class的相关内容,可以阅读本专题下面的文章。

533

2024.01.03

python中class的含义
python中class的含义

本专题整合了python中class的相关内容,阅读专题下面的文章了解更多详细内容。

17

2025.12.06

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1457

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

709

2023.06.29

java连接字符串方法汇总
java连接字符串方法汇总

本专题整合了java连接字符串教程合集,阅读专题下面的文章了解更多详细操作。

4

2026.02.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8.5万人学习

Git 教程
Git 教程

共21课时 | 3.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号