Linux OOM 发生前系统有哪些征兆

舞姬之光

发布时间：2026-02-05 19:28:02

169人浏览过

来源于php中文网

原创

Linux内存告警四特征：1. free -m显示available≈0但buff/cache很高；2. dmesg出现“or sacrifice child”日志且Badness得分＞800；3. vmstat中si/so持续非零、pgmajfault飙升；4. 容器内memory.usage_in_bytes逼近limit且failcnt递增，limit设为-1可能因溢出误触发OOM。

linux oom 发生前系统有哪些征兆

系统响应明显变慢，`free -m` 显示 `available` 接近 0 但 `buff/cache` 很高

这不是“真缺内存”，而是 Linux 把空闲内存全拿去缓存文件了。一旦新进程要内存，内核得先回收缓存；如果回收不过来，就直奔 OOM。此时 free -m 看起来像“只剩 50MB 可用”，但 buff/cache 占了 8GB——这是典型预警信号，不是故障已发生，而是缓冲区快压不住了。

`dmesg -T | grep -i "killed process"` 开始出现，但还没真正 kill 进程

OOM Killer 在真正动手前会试探性记录。你可能先看到类似这样的日志：

Out of memory: Kill process 12345 (java) score 892 or sacrifice child

注意关键词：or sacrifice child 表示内核还在权衡要不要杀子进程；score 892 是 Badness 得分（越高越危险），超过 800 就该警觉了。这个阶段系统还能跑，但已经进入“临界滑坡”——只要再有一个大内存申请（比如日志轮转、定时任务、数据库查询），就会触发真实 kill。

频繁触发 `pgmajfault`，`vmstat 1` 中 `si/so` 持续非零

用 vmstat 1 观察时，如果 si（swap in）和 so（swap out）列持续大于 0，说明物理内存已严重不足，内核正疯狂把进程页换入换出。同时 pgmajfault（重大缺页）数值飙升，意味着进程不断访问尚未映射到物理内存的虚拟地址，被迫等内核现场分配页——这正是 OOM 前最耗时的卡顿来源。

达芬奇

达芬奇——你的AI创作大师

下载

正常负载下 si/so 应长期为 0；
哪怕有 Swap，so > 100 KB/s 持续 30 秒以上，基本等于在给 OOM 倒计时；
此时 top 里 %MEM 排名靠前的进程未必是元凶——短生命周期+高内存申请速率的进程（如 Python 脚本批量读 CSV）更危险，但 top 看不到它刚启动那几秒的爆发式申请。

容器环境里 `docker stats` 或 `cgroup` 内存统计突然跳变

在 Docker/K8s 环境中，OOM 往往先发生在单个容器内（cgroup memory limit 被突破），而非宿主机全局。此时宿主机 free 可能还很宽裕，但容器内 cat /sys/fs/cgroup/memory/memory.usage_in_bytes 会逼近 memory.limit_in_bytes，且 memory.failcnt 开始递增。Kubernetes 的 Events 里会出现 OOMKilled 状态，但比宿主机级 OOM 日志晚几秒——因为 cgroup 层的 OOM 是独立触发的，不经过宿主机 oom_killer 流程。

最容易被忽略的一点：memory.limit_in_bytes 设为 -1（不限制）≠ 安全。某些旧版 runC 或内核版本下，-1 实际会被解释为极大值（如 2^63），导致 cgroup 内存统计溢出、误判为超限，进而提前触发容器级 OOM。务必确认实际生效值：cat /sys/fs/cgroup/memory/memory.limit_in_bytes 返回的是数字，不是 -1。

Linux ext4 与 xfs 的运维选择策略

Linux 日志轮转失败导致磁盘占满的处理

Linux 存储容量规划的方法论

Linux 内存回收不及时的可能原因

Linux Swap 使用率异常升高的排查

相关标签:

linux python java docker csv ai kubernetes docker 数据库 kubernetes linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux 自动化部署失败的排错思路下一篇：暂无

作者最新文章

Linux 服务配置修改后未生效的排查

2026-02-04 17:02

1688进货批发网官网首页_1688采购进货批发平台官方入口

2026-02-04 17:10

2026年百度集卡分5亿红包的钱在哪里查看?怎么提现

2026-02-04 17:19

三角洲刘涛送六套活动怎么参与？官方活动入口

2026-02-04 17:24

SQL 如何监控表碎片（MySQL OPTIMIZE TABLE 的触发条件）

2026-02-04 17:34

2026春晚主持人定了吗 2026年央视春晚主持人阵容

2026-02-04 17:36

智学网官网入口智学网网站官网入口

2026-02-04 17:50

智学网官网入口版智学网学生登录入口

2026-02-04 17:51

智学网怎么查成绩学生查询个人成绩入口

2026-02-04 17:53

Claude Max 20官网入口在哪？Claude Max套餐说明

2026-02-04 17:54

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

k8s和docker区别

k8s和docker区别有抽象层次不同、管理范围不同、功能不同、应用程序生命周期管理不同、缩放能力不同、高可用性等等区别。本专题为大家提供k8s和docker区别相关的各种文章、以及下载和课程。

263

2023.07.24

docker进入容器的方法有哪些

docker进入容器的方法：1. Docker exec；2. Docker attach；3. Docker run --interactive --tty；4. Docker ps -a；5. 使用 Docker Compose。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

503

2024.04.08

docker容器无法访问外部网络怎么办

docker 容器无法访问外部网络的原因和解决方法：配置 nat 端口映射以将容器端口映射到主机端口。根据主机兼容性选择正确的网络驱动（如 host 或 overlay）。允许容器端口通过主机的防火墙。配置容器的正确 dns 服务器。选择正确的容器网络模式。排除主机网络问题，如防火墙或连接问题。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

405

2024.04.08

docker镜像有什么用

docker 镜像是预构建的软件组件，用途广泛，包括：应用程序部署：简化部署，提高移植性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

445

2024.04.08

数据库三范式

数据库三范式是一种设计规范，用于规范化关系型数据库中的数据结构，它通过消除冗余数据、提高数据库性能和数据一致性，提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

362

2023.06.29

如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构，作用包括：1、释放存储空间；2、确保数据的安全性；3、提高数据库的整体性能，加速查询和操作的执行速度。尽管删除数据库具有一些好处，但在执行任何删除操作之前，务必谨慎操作，并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构，无法回滚。

2087

2023.08.14