ss -m 显示 TCP 内存占用巨大但进程 RSS 很小的 socket 泄漏排查

冷炫風刃

发布时间：2026-01-21 17:29:02

119人浏览过

来源于php中文网

原创

典型原因是应用层未及时读取或关闭连接导致内核缓冲区持续堆积；可通过ss -m查rmem/wmem、strace跟踪recv/read调用、tcpdump分析流量、检查setsockopt设置等交叉验证定位。

ss -m 显示 tcp 内存占用巨大但进程 rss 很小的 socket 泄漏排查

当 ss -m 显示某个 socket 的 rmem 或 wmem 达到几 MB 甚至上百 MB，而对应进程的 RSS（ps aux --sort=-rss 或 /proc/PID/status 中的 RSS）却只有几百 KB，这通常不是内存统计口径差异的问题，而是典型的 **socket 接收/发送队列积压未消费**，即“socket 泄漏”的一种表现——更准确地说，是 **应用层未及时读取或关闭连接导致内核缓冲区持续堆积**。

确认是否为接收队列（rmem）积压

运行 ss -tulnmp | grep :PORT（替换 PORT），重点关注 Recv-Q 和 rmem 字段：

Recv-Q 非零且持续增长 → 应用未调用 recv()/read() 消费数据
rmem 值远大于 sysctl net.core.rmem_max（如显示 2MB 但 rmem_max 是 212992）→ 内核已突破默认上限，说明该 socket 被长期持有且数据不断写入
配合 cat /proc/PID/fd/ | wc -l 查看 fd 数是否异常增长，可辅助判断是否真有大量 socket 未 close

检查应用是否卡在阻塞 I/O 或逻辑死锁

很多服务（如 Python 的 socket.recv()、Node.js 的 net.Socket、Java 的 InputStream.read()）默认使用阻塞模式。一旦对端发来数据但业务逻辑未处理（比如反序列化失败、回调未注册、线程池耗尽），就会导致 recv 缓冲区越堆越多：

星月写作

专为网络小说、剧本创作者打造的AI增效工具

下载

用 strace -p PID -e trace=recvfrom,read,close 观察是否有长时间无系统调用返回，或 recvfrom 返回 0（对端 FIN）但进程没 close
检查日志中是否有反序列化异常、超时重试循环、空指针导致 handler 退出但 socket 未释放等逻辑缺陷
Golang 程序要特别注意 goroutine 泄漏：启动了 go handleConn() 却因 channel 阻塞或 panic 未 recover，导致 conn 对象无法被 GC，底层 socket 一直存活

排查 SO_RCVBUF/SO_SNDBUF 手动设置过大或禁用自动调优

某些程序显式调用 setsockopt(fd, SOL_SOCKET, SO_RCVBUF, &val, sizeof(val)) 并设为极大值（如 16MB），又关闭了 TCP autotuning（net.ipv4.tcp_rmem 第三项被绕过），会导致单个 socket 占用内核内存失控：

用 bpftrace -e 'kprobe:tcp_setsockopt { printf("pid=%d, optname=%d\n", pid, arg2); }' | grep -E "(SO_RCVBUF|SO_SNDBUF)" 监控可疑 setsockopt 调用
检查代码中是否硬编码了超大 buffer，并确认是否调用了 setsockopt(fd, SOL_SOCKET, SO_RCVBUFFORCE, ...)（需 CAP_NET_ADMIN）
临时修复：改小 net.core.rmem_max（如 sysctl -w net.core.rmem_max=4194304），观察新连接是否仍堆积；长期应删掉非必要手动 setsockopt

验证是否由对端疯狂发包但本端无响应引起

即使你的程序逻辑正常，若上游客户端不遵守流控（如 UDP 打洞后误用 TCP、IoT 设备固件 bug），也会造成单边堆积：

用 tcpdump -i any port PORT -w debug.pcap 抓包，过滤出该 socket 的四元组，观察是否有大量重复 ACK、ZeroWindow、或持续的 PSH+ACK 数据包涌入
检查 /proc/net/snmp 中 Tcp: 行的 InErrs、AttemptFails 是否突增，可能暗示连接建立失败后重传风暴
在服务端加限速：用 tc qdisc add dev eth0 root tbf rate 1mbit burst 32kbit latency 400ms 临时抑制流量，看 rmem 是否回落

这类问题本质是应用与内核协作失衡，核心不在“泄漏”而在“停滞”。定位关键在于交叉比对 ss -m、strace、tcpdump 和业务日志，找到那个“收得到但不敢/不能处理”的临界点。

Linux 自动化巡检脚本实现

Linux 容器化进阶与优化

Linux eBPF 的 bcc vs bpftrace vs libbpf-tools 的开发工具链对比

Linux 自动化巡检与故障排查

Linux top 与 htop 进程监控技巧

相关标签:

python java js node.js node go golang 编码 ai win stream 内存占用 golang sort printf 循环指针堆线程空指针 channel JS 对象 udp tcpdump iot bug

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：bpftrace 运行时报 "ERROR: Failed to compile BPF program" 的常见语法坑下一篇：grub rescue 提示后如何用 live USB 修复 GRUB2（2025最新）

作者最新文章

SQL报表时间维度统计慢_时间索引优化

2026-03-11 11:53

SQL ShardingSphere 的 binding table 与 join 路由优化实践

2026-03-11 12:16

Linux磁盘空间不足排查_磁盘占用分析方法

2026-03-11 12:53

Linux高并发优化方案_系统参数综合调优

2026-03-11 13:01

PHP 数据库主从复制原理解析

2026-03-11 14:02

Linux磁盘快照使用_快照备份与回滚实践

2026-03-11 14:08

Linux运维稳定性建设_高可用运维思路

2026-03-11 14:16

SQL 定时事件 EVENT 创建与管理优化技巧

2026-03-11 14:53

SQL日志刷盘慢问题_redo与binlog优化

2026-03-11 15:21

SQL查询缓存设计_查询结果缓存策略

2026-03-11 15:22

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

golang如何定义变量

golang定义变量的方法：1、声明变量并赋予初始值“var age int =值”；2、声明变量但不赋初始值“var age int”；3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

210

2024.02.23

golang有哪些数据转换方法

golang数据转换方法：1、类型转换操作符；2、类型断言；3、字符串和数字之间的转换；4、JSON序列化和反序列化；5、使用标准库进行数据转换；6、使用第三方库进行数据转换；7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

247

2024.02.23

golang常用库有哪些

golang常用库有：1、标准库；2、字符串处理库；3、网络库；4、加密库；5、压缩库；6、xml和json解析库；7、日期和时间库；8、数据库操作库；9、文件操作库；10、图像处理库。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

356

2024.02.23

golang和python的区别是什么

golang和python的区别是：1、golang是一种编译型语言，而python是一种解释型语言；2、golang天生支持并发编程，而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

214

2024.03.05

golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型，并具有垃圾回收功能的开源编程语言，采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

409

2024.05.21

golang结构体相关大全

本专题整合了golang结构体相关大全，想了解更多内容，请阅读专题下面的文章。

490

2025.06.09

golang相关判断方法

本专题整合了golang相关判断方法，想了解更详细的相关内容，请阅读下面的文章。

200

2025.06.10

golang数组使用方法

本专题整合了golang数组用法，想了解更多的相关内容，请阅读专题下面的文章。

1438

2025.06.17

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板