0

0

Linux OOM 发生前系统有哪些征兆

舞姬之光

舞姬之光

发布时间:2026-02-05 19:28:02

|

169人浏览过

|

来源于php中文网

原创

Linux内存告警四特征:1. free -m显示available≈0但buff/cache很高;2. dmesg出现“or sacrifice child”日志且Badness得分>800;3. vmstat中si/so持续非零、pgmajfault飙升;4. 容器内memory.usage_in_bytes逼近limit且failcnt递增,limit设为-1可能因溢出误触发OOM。

linux oom 发生前系统有哪些征兆

系统响应明显变慢,free -m 显示 available 接近 0 但 buff/cache 很高

这不是“真缺内存”,而是 Linux 把空闲内存全拿去缓存文件了。一旦新进程要内存,内核得先回收缓存;如果回收不过来,就直奔 OOM。此时 free -m 看起来像“只剩 50MB 可用”,但 buff/cache 占了 8GB——这是典型预警信号,不是故障已发生,而是缓冲区快压不住了。

dmesg -T | grep -i "killed process" 开始出现,但还没真正 kill 进程

OOM Killer 在真正动手前会试探性记录。你可能先看到类似这样的日志:

Out of memory: Kill process 12345 (java) score 892 or sacrifice child

注意关键词:or sacrifice child 表示内核还在权衡要不要杀子进程;score 892 是 Badness 得分(越高越危险),超过 800 就该警觉了。这个阶段系统还能跑,但已经进入“临界滑坡”——只要再有一个大内存申请(比如日志轮转、定时任务、数据库查询),就会触发真实 kill。

频繁触发 pgmajfaultvmstat 1si/so 持续非零

vmstat 1 观察时,如果 si(swap in)和 so(swap out)列持续大于 0,说明物理内存已严重不足,内核正疯狂把进程页换入换出。同时 pgmajfault(重大缺页)数值飙升,意味着进程不断访问尚未映射到物理内存的虚拟地址,被迫等内核现场分配页——这正是 OOM 前最耗时的卡顿来源。

达芬奇
达芬奇

达芬奇——你的AI创作大师

下载
  • 正常负载下 si/so 应长期为 0;
  • 哪怕有 Swap,so > 100 KB/s 持续 30 秒以上,基本等于在给 OOM 倒计时;
  • 此时 top 里 %MEM 排名靠前的进程未必是元凶——短生命周期+高内存申请速率的进程(如 Python 脚本批量读 CSV)更危险,但 top 看不到它刚启动那几秒的爆发式申请。

容器环境里 docker statscgroup 内存统计突然跳变

在 Docker/K8s 环境中,OOM 往往先发生在单个容器内(cgroup memory limit 被突破),而非宿主机全局。此时宿主机 free 可能还很宽裕,但容器内 cat /sys/fs/cgroup/memory/memory.usage_in_bytes 会逼近 memory.limit_in_bytes,且 memory.failcnt 开始递增。Kubernetes 的 Events 里会出现 OOMKilled 状态,但比宿主机级 OOM 日志晚几秒——因为 cgroup 层的 OOM 是独立触发的,不经过宿主机 oom_killer 流程。

最容易被忽略的一点:memory.limit_in_bytes 设为 -1(不限制)≠ 安全。某些旧版 runC 或内核版本下,-1 实际会被解释为极大值(如 2^63),导致 cgroup 内存统计溢出、误判为超限,进而提前触发容器级 OOM。务必确认实际生效值:cat /sys/fs/cgroup/memory/memory.limit_in_bytes 返回的是数字,不是 -1。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
k8s和docker区别
k8s和docker区别

k8s和docker区别有抽象层次不同、管理范围不同、功能不同、应用程序生命周期管理不同、缩放能力不同、高可用性等等区别。本专题为大家提供k8s和docker区别相关的各种文章、以及下载和课程。

263

2023.07.24

docker进入容器的方法有哪些
docker进入容器的方法有哪些

docker进入容器的方法:1. Docker exec;2. Docker attach;3. Docker run --interactive --tty;4. Docker ps -a;5. 使用 Docker Compose。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

503

2024.04.08

docker容器无法访问外部网络怎么办
docker容器无法访问外部网络怎么办

docker 容器无法访问外部网络的原因和解决方法:配置 nat 端口映射以将容器端口映射到主机端口。根据主机兼容性选择正确的网络驱动(如 host 或 overlay)。允许容器端口通过主机的防火墙。配置容器的正确 dns 服务器。选择正确的容器网络模式。排除主机网络问题,如防火墙或连接问题。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

405

2024.04.08

docker镜像有什么用
docker镜像有什么用

docker 镜像是预构建的软件组件,用途广泛,包括:应用程序部署:简化部署,提高移植性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

445

2024.04.08

数据库三范式
数据库三范式

数据库三范式是一种设计规范,用于规范化关系型数据库中的数据结构,它通过消除冗余数据、提高数据库性能和数据一致性,提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

362

2023.06.29

如何删除数据库
如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构,作用包括:1、释放存储空间;2、确保数据的安全性;3、提高数据库的整体性能,加速查询和操作的执行速度。尽管删除数据库具有一些好处,但在执行任何删除操作之前,务必谨慎操作,并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构,无法回滚。

2087

2023.08.14

vb怎么连接数据库
vb怎么连接数据库

在VB中,连接数据库通常使用ADO(ActiveX 数据对象)或 DAO(Data Access Objects)这两个技术来实现:1、引入ADO库;2、创建ADO连接对象;3、配置连接字符串;4、打开连接;5、执行SQL语句;6、处理查询结果;7、关闭连接即可。

351

2023.08.31

MySQL恢复数据库
MySQL恢复数据库

MySQL恢复数据库的方法有使用物理备份恢复、使用逻辑备份恢复、使用二进制日志恢复和使用数据库复制进行恢复等。本专题为大家提供MySQL数据库相关的文章、下载、课程内容,供大家免费下载体验。

256

2023.09.05

java连接字符串方法汇总
java连接字符串方法汇总

本专题整合了java连接字符串教程合集,阅读专题下面的文章了解更多详细操作。

7

2026.02.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8.5万人学习

Git 教程
Git 教程

共21课时 | 3.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号