0

0

Linux sar -n DEV / -n TCP / -n ETCP 的网络指标采集频率与阈值告警

冷炫風刃

冷炫風刃

发布时间:2026-02-24 11:35:02

|

469人浏览过

|

来源于php中文网

原创

sar -n dev 的 rxkb/s、txkb/s 是采样周期内的平均速率,非瞬时值;例如 sar -n dev 1 3 中每行表示前1秒内收发字节数除以1秒的结果,单位为kb(千字节),换算mbps需×8÷1000。

linux sar -n dev / -n tcp / -n etcp 的网络指标采集频率与阈值告警

sar -n DEV 输出的 rxkB/s、txkB/s 是瞬时速率还是平均值?

是采样周期内的平均值,不是瞬时快照。比如 sar -n DEV 1 3 每秒采一次、共3次,每行的 rxkB/s 表示前1秒内网卡实际收到的字节数除以1秒的结果。

  • 单位是 kB(千字节),不是 KiB;换算成带宽常用 Mbps 时,要 ×8÷1000(非÷1024)
  • 如果用 sar -n DEV 5 连续跑,第一行其实是从命令启动时刻到第5秒的平均,后续每行才是严格5秒窗口平均
  • 注意:Linux 内核在采样时刻读取的是 /proc/net/dev 的累计计数器,差值再除以时间,所以短周期(如1秒)下受突发流量影响大,容易误判为“持续打满”

为什么 sar -n TCP 的 active/s 和 passive/s 长期为 0?

这两个指标统计的是「新建立连接」的动作次数,不是连接数本身。如果业务用长连接(如 HTTP/2、gRPC、数据库连接池),active/s(主动发起连接)和 passive/s(被动接受连接)可能极低甚至为0,不代表网络空闲。

  • active/s 对应内核中 tcp_active_opens 计数器,只增在 connect() 成功返回时
  • passive/s 对应 tcp_passive_opens,只增在 accept() 返回新 socket 时
  • 常见误判场景:Nginx 反向代理后端用 keepalive,或 Java 应用配了 HikariCP 连接池,此时连接复用率高,新建连接极少
  • 要看当前连接状态,得结合 ss -snetstat -s | grep -i "established\|time wait"

sar -n ETCP 的 RetransSeg 和 AtmptFails 什么情况下真该报警?

这两个字段反映 TCP 重传行为,但直接设固定阈值(比如 >10 就告警)极易误报。关键看趋势和上下文。

  • RetransSeg 是重传的数据段数量,单次采样值意义不大;应关注 5 分钟滑动窗口内是否持续 >0.5% 的重传率(重传段数 ÷ 总发出段数)
  • AtmptFails 是 connect() 失败次数,常见于对端拒绝(RST)、SYN 超时、防火墙拦截;突然跳升往往比绝对值更有意义
  • 注意干扰项:本地丢包(如网卡 ring buffer 溢出)会抬高 RetransSeg,但 sar -n DEV 中对应网卡的 rxerr/stxerr/s 也会同步上升
  • 别忘了检查 /proc/net/snmp 里的 Tcp: RetransSegs 和 TcpExt: TCPTimeouts,sar 读的就是这里,但原始精度更高

采集频率设多少才不丢关键抖动、又不压垮系统?

默认 10 秒太粗,1 秒太密——折中推荐 3 秒,但必须配合归档策略,否则 sar 日志体积爆炸。

  • 高频(≤2 秒)采集时,sadc 自身 CPU 占用可能达 1–3%,尤其多网卡+多 CPU 机器上;用 top -p $(pgrep sadc) 可验证
  • 低于 5 秒的采样,在 sysstat 12.0+ 版本里建议显式加 -S 参数启用毫秒级时间戳,避免多行挤在同一秒内导致聚合失真
  • 真正要捕获微秒级抖动(如 RDMA、DPDK 场景),sar 不适用,得切到 perf record -e net:* -a 或 eBPF 工具
  • 生产环境建议:用 sar -n DEV -n TCP -n ETCP 3 120(即每3秒一次、持续6分钟)做巡检快照,而非 24×7 全量记录

实际部署时最容易被忽略的,是 sar 数据的时间基准依赖系统时钟稳定性——NTP 调整或 chrony 跳变会导致采样间隔错乱,RetransSeg 等指标出现负值或尖峰。别只盯着阈值,先确认 timedatectl statusSystem clock synchronized: yesNTP service: active

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
nginx 重启
nginx 重启

nginx重启对于网站的运维来说是非常重要的,根据不同的需求,可以选择简单重启、平滑重启或定时重启等方式。本专题为大家提供nginx重启的相关的文章、下载、课程内容,供大家免费下载体验。

240

2023.07.27

nginx 配置详解
nginx 配置详解

Nginx的配置是指设置和调整Nginx服务器的行为和功能的过程。通过配置文件,可以定义虚拟主机、HTTP请求处理、反向代理、缓存和负载均衡等功能。Nginx的配置语法简洁而强大,允许管理员根据自己的需要进行灵活的调整。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

518

2023.08.04

nginx配置详解
nginx配置详解

NGINX与其他服务类似,因为它具有以特定格式编写的基于文本的配置文件。本专题为大家提供nginx配置相关的文章,大家可以免费学习。

567

2023.08.04

tomcat和nginx有哪些区别
tomcat和nginx有哪些区别

tomcat和nginx的区别:1、应用领域;2、性能;3、功能;4、配置;5、安全性;6、扩展性;7、部署复杂性;8、社区支持;9、成本;10、日志管理。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

243

2024.02.23

nginx报404怎么解决
nginx报404怎么解决

当访问 nginx 网页服务器时遇到 404 错误,表明服务器无法找到请求资源,可以通过以下步骤解决:1. 检查文件是否存在且路径正确;2. 检查文件权限并更改为 644 或 755;3. 检查 nginx 配置,确保根目录设置正确、没有冲突配置等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

584

2024.07.09

Nginx报404错误解决方法
Nginx报404错误解决方法

解决方法:只需要加上这段配置:try_files $uri $uri/ /index.html;即可。想了解更多Nginx的相关内容,可以阅读本专题下面的文章。

3606

2024.08.07

nginx部署php项目教程汇总
nginx部署php项目教程汇总

本专题整合了nginx部署php项目教程汇总,阅读专题下面的文章了解更多详细内容。

51

2026.01.13

nginx配置文件详细教程
nginx配置文件详细教程

本专题整合了nginx配置文件相关教程详细汇总,阅读专题下面的文章了解更多详细内容。

67

2026.01.13

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1228

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 9.6万人学习

Git 教程
Git 教程

共21课时 | 3.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号