进程被 OOM kill 但 oom_score_adj 已调低仍被选中的隐藏规则

舞姬之光

发布时间：2026-01-22 19:16:02

657人浏览过

来源于php中文网

原创

oom killer按cgroup局部决策，oom_score_adj仅在同cgroup内生效；badness得分由实际内存占用（含匿名页等）、cgroup压力系数等加权计算，-1000不等于免疫。

进程被 oom kill 但 oom_score_adj 已调低仍被选中的隐藏规则

进程被 OOM kill 却已将 oom_score_adj 设为较低值（比如 -1000），仍被选中，往往不是因为配置没生效，而是内核在最终决策时引入了几个**不常被文档强调、但实际起决定性作用的隐藏规则**。

内存压力来源决定“谁该死”的优先级范围

OOM killer 不是全局扫描所有进程挑分最低的，而是先聚焦于**触发 OOM 的内存域（memory cgroup 或 NUMA node）内正在分配失败的进程所属的 cgroup**。即使你把某个后台服务的 oom_score_adj 调到 -1000，只要它恰好运行在当前内存紧张的 cgroup 里，而同 cgroup 内其他进程的分更高，它就可能成为备选——哪怕宿主机上还有大量空闲内存。

检查方式：cat /proc/<pid>/cgroup</pid> 看进程归属；cat /sys/fs/cgroup/memory/<cgroup_path>/memory.oom_control</cgroup_path> 查该 cgroup 是否已触发过 OOM
关键点：OOM 是按 cgroup 隔离粒度触发的，oom_score_adj 只在本 cgroup 内有效

实际内存占用 ≠ RSS，内核看的是 badness score 的完整计算逻辑

oom_score_adj 只是 badness 公式中的一个偏移项，真正得分由以下几项加权得出：

进程实际使用的内存页数（包括匿名页、文件缓存脏页、swapcached 页等） —— 这比 rss 更大，尤其对 mmap 大文件、使用 tmpfs 或有大量 page cache 的进程影响显著
进程的 CPU 时间权重（越老的进程权重略低） —— 但影响微弱，通常可忽略
是否为 superuser 进程（uid 0）会轻微降低得分
oom_score_adj 值线性叠加，但有上下限（-1000 到 +1000） —— 设为 -1000 并不等于“免疫”，只是让基础分归零；若其内存占用是同类进程的 10 倍，仍可能高于其他轻量进程

某些内存类型会被“加倍惩罚”

内核对以下两类内存，在计算 badness 时会额外加重计分：

人民网AIGC-X

国内科研机构联合推出的AI生成内容检测工具

下载

不可回收的匿名页（如 malloc 分配、堆栈、mmap(MAP_ANONYMOUS)） —— 因无法写回磁盘，回收代价最高
属于 memcg 且超出 memory.high 限制后继续增长的内存 —— 此时该 cgroup 已进入“压力模式”，其内进程的 badness 会被乘以一个增长系数（2x~4x），oom_score_adj 无法抵消该放大效应

例如：一个 Java 进程设了 oom_score_adj = -1000，但它的 heap 和 metaspace 占用 4GB 且全部是匿名页，同时所在 cgroup 已超 memory.high=3G，那么它的实际 badness 很可能远高于一个只占 500MB 但 oom_score_adj = 0 的 Nginx 进程。

确认是否真被 OOM killer 杀掉，而非其他机制

别默认日志里出现 “Killed process” 就是 OOM killer 所为：

检查 dmesg -T | grep -i "killed process" 输出中是否有 Out of memory: Kill process 开头的完整行 —— 这才是 OOM killer 日志
若只有 Memory cgroup out of memory 但无后续 kill 行，可能是 cgroup v2 的 memory.oom 控制器直接 freeze 进程，而非发送 SIGKILL
某些容器运行时（如 containerd）或 systemd 服务会拦截 OOM 事件并自行重启/退出，掩盖真实原因

不复杂但容易忽略。

Linux 性能监控与诊断实战

Linux 内核事件追踪 eBPF 实战

Linux CPU 使用率异常升高的排查思路

/dev/shm 被塞满导致 Redis / PostgreSQL / Java 崩溃的业务场景

Linux CPU 飙高的排查流程

相关标签:

java node nginx 栈 ai 内存占用 nginx 栈堆事件

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux 服务器出现 "Read-only file system" 后如何安全修复而不丢失数据下一篇：getenforce 显示 Permissive 但服务仍被拒绝的 boolean 值误关排查

作者最新文章

GitHub 代码复现跑不通怎么办？常见失败原因与排查方法

2026-03-11 12:20

Linux网络不通怎么排查_ping网络诊断方法

2026-03-11 12:44

Linux系统怎么更新_补丁管理方法

2026-03-11 12:46

Linux 内存持续增长_内存泄漏定位

2026-03-11 12:59

LinuxTIME_WAIT过多_端口耗尽治理方案

2026-03-11 13:05

Linux磁盘挂载缓慢_挂载性能问题分析

2026-03-11 13:12

Linux 性能优化误区总结_常见错误解析

2026-03-11 13:54

MySQL 面试常见问题完整汇总

2026-03-11 14:34

网易云游戏入口网易云游戏官方入口地址

2026-03-11 14:46

Linux 多文件日志搜索方法

2026-03-11 15:24

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

nginx 重启

nginx重启对于网站的运维来说是非常重要的，根据不同的需求，可以选择简单重启、平滑重启或定时重启等方式。本专题为大家提供nginx重启的相关的文章、下载、课程内容，供大家免费下载体验。

246

2023.07.27

nginx 配置详解

Nginx的配置是指设置和调整Nginx服务器的行为和功能的过程。通过配置文件，可以定义虚拟主机、HTTP请求处理、反向代理、缓存和负载均衡等功能。Nginx的配置语法简洁而强大，允许管理员根据自己的需要进行灵活的调整。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

522

2023.08.04

nginx配置详解

NGINX与其他服务类似，因为它具有以特定格式编写的基于文本的配置文件。本专题为大家提供nginx配置相关的文章，大家可以免费学习。

610

2023.08.04

tomcat和nginx有哪些区别

tomcat和nginx的区别：1、应用领域；2、性能；3、功能；4、配置；5、安全性；6、扩展性；7、部署复杂性；8、社区支持；9、成本；10、日志管理。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

244

2024.02.23

nginx报404怎么解决

当访问 nginx 网页服务器时遇到 404 错误，表明服务器无法找到请求资源，可以通过以下步骤解决：1. 检查文件是否存在且路径正确；2. 检查文件权限并更改为 644 或 755；3. 检查 nginx 配置，确保根目录设置正确、没有冲突配置等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

693

2024.07.09

Nginx报404错误解决方法

解决方法：只需要加上这段配置：try_files $uri $uri/ /index.html;即可。想了解更多Nginx的相关内容，可以阅读本专题下面的文章。

3618

2024.08.07

nginx部署php项目教程汇总

本专题整合了nginx部署php项目教程汇总，阅读专题下面的文章了解更多详细内容。

2026.01.13

nginx配置文件详细教程

本专题整合了nginx配置文件相关教程详细汇总，阅读专题下面的文章了解更多详细内容。

2026.01.13

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板