Linux 内存占用逐步升高的排错思路

冰川箭仙

发布时间：2026-02-04 18:31:15

990人浏览过

来源于php中文网

原创

Linux cached内存可自动回收，关键看MemAvailable是否持续逼近0及OOM Killer日志；需排查overcommit设置、cgroup限制、NFS缓存、句柄泄漏及业务变更点。

linux 内存占用逐步升高的排错思路

内存占用持续上涨但 `free` 显示有大量 `cached`

Linux 的 cached 内存（页缓存）本就是可回收的，只要应用需要，内核会自动释放。别一看到 free -h 里 available 值低就断定“内存泄漏”。关键看 available 是否持续逼近 0，以及是否有进程因 OOM 被杀——这才是真压力。

实操建议：

用 free -h 看 available 列，不是 free 列
运行 watch -n 1 'free -h; echo; cat /proc/meminfo | grep -E "^(MemAvailable|Cached|SReclaimable)"; echo; ps aux --sort=-%mem | head -5' 持续观察趋势
Cached 高但 SReclaimable 占比低（比如 MADV_DONTNEED 或文件被锁）

确认是否存在用户态内存泄漏：用 `pmap` 和 `/proc/[pid]/smaps`

单个进程 RSS 持续增长，且不随业务负载下降而回落，才值得怀疑泄漏。不要只看 top 的 %MEM 排序——它按比例算，小进程占比高但绝对值未必大。

实操建议：

先用 ps aux --sort=-rss | head -10 找 RSS 最大的进程，再查其 pmap -x [pid]，关注 mapped 和 written 列是否异常增长
深入看 cat /proc/[pid]/smaps | awk '/^Size:/ {sum+=$2} END {print sum}' 统计总虚拟内存；对比 Rss: 和 Pss:，若 Rss 持续涨而 Pss 不涨，可能是共享内存或 mmap 区域在累积
对 Java 进程，优先用 jstat -gc [pid] 看老年代是否持续增长且 GC 后不回落；对 Go 进程，检查 GODEBUG=madvdontneed=1 是否缺失（旧版 Go 默认不主动归还内存）

`slabtop` 显示 `kmalloc-*` 或 `dentry` 占用飙升

内核 slab 分配器里的对象（如 dentry、inode、ext4_inode_cache）持续增长，往往意味着文件系统层存在资源未释放：比如程序反复 open 不 close、遍历海量小文件后未释放 dcache、或 NFS 客户端元数据缓存堆积。

Viggle AI

Viggle AI是一个AI驱动的3D动画生成平台，可以帮助用户创建可控角色的3D动画视频。

下载

实操建议：

运行 slabtop -o（实时排序），重点关注 ACTIVE 和 NUMA 列；若 dentry > 10M 且稳定上升，用 find /proc/*/fd -ls 2>/dev/null | grep -c '\->' | sort -n 查打开文件数异常的进程
临时清理：echo 2 > /proc/sys/vm/drop_caches（仅清 dentry/inode 缓存，不影响 page cache）；但这是治标，需配合 lsof +D /path 定位长期持有句柄的进程
排查 NFS 挂载时，注意 nfsstat -c 中 dcache 命中率，若低于 80%，可能客户端缓存策略过激，需调 acregmin/acregmax

OOM Killer 日志里反复出现同一进程被杀

这不是内存“占用高”，而是内存真的不够用了。dmesg -T | grep -i "killed process" 会显示被杀进程名、触发时的 MemAvailable 值和各内存域状态。重点不是“谁被杀”，而是“为什么只剩这点可用内存”。

实操建议：

检查 /proc/sys/vm/overcommit_memory：值为 2 时启用严格 overcommit，vm.overcommit_ratio 设置过低（如默认 50）会导致大进程 malloc 失败，看似泄漏，实为限制
确认是否启用了 cgroup v1 的 memory limit（cat /sys/fs/cgroup/memory/[group]/memory.limit_in_bytes），容器场景下常因配置过小导致进程被 OOM 而非真正泄漏
若日志中 pgpgin/pgpgout 极高，说明频繁换入换出，可能是物理内存不足 + swap 使用过度，此时应优先关 swap（swapoff -a）并加内存，而非调优应用

最易被忽略的是：内存增长曲线和业务日志的时间戳对不上。先做时间对齐，再排除定时任务、日志轮转、监控 agent 自身 bug 这类“伪泄漏”。真实泄漏往往安静，但会在某次 deploy 后突然显现——盯紧变更点。

Linux 服务启动顺序配置实战

Linux 系统暴露端口的安全风险评估

Linux 运维经验如何沉淀为流程

Linux 磁盘 IO 等待过高的定位方法

Linux SSH 配置错误导致无法登录的恢复方案

相关标签:

linux java js node go app 虚拟内存 ai 内存占用为什么 echo print NULL sort 堆对象 linux bug

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：irqbalance 服务失效导致单核 net_rx 打满的 irq affinity 手动绑定方法下一篇：Linux 文件系统写入变慢的根因分析

作者最新文章

百度集卡活动怎么玩 2026百度集卡分5亿活动玩法攻略

2026-02-04 17:16

mdadm RAID rebuild 极慢的 bitmap / speed_limit_min/max 加速参数

2026-02-04 17:32

2026百度春节分5亿活动攻略官方活动入口秒参与

2026-02-04 17:38

Claude中文版镜像网站靠谱吗？Claude镜像站使用风险说明

2026-02-04 17:41

PostgreSQL 物化视图在高频查询聚合场景的刷新策略

2026-02-04 17:42

chronyc tracking Root delay / dispersion 异常大的 NTP 源更换方案

2026-02-04 17:43

vivo云服务官网在哪 VIVO云服务官网怎么找

2026-02-04 17:51

Linux 网络通信的整体流程

2026-02-04 17:51

豆包生成AI图片怎样才能精准提升出图准确率技巧

2026-02-04 17:51

vivo云服务器官网入口 vivo定位云服务官网

2026-02-04 17:53

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容，供大家免费下载体验。

187

2023.09.27

python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容，阅读专题下面的文章了解更多详细教程。

2026.02.03

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

238

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

560

2024.03.01

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

396

2023.09.04