Linux OOM Killer 的触发机制与 oom_score_adj 调优最佳实践

冷炫風刃

发布时间：2026-03-05 15:40:12

799人浏览过

来源于php中文网

原创

oom killer 在系统物理内存彻底耗尽、无法回收足够页帧时被触发，内核遍历用户态进程，按 badness 分数（rss+swap 占用 × oom_score_adj 归一化系数 ÷ 总可用页数）选择最高者发送 sigkill。

linux oom killer 的触发机制与 oom_score_adj 调优最佳实践

Linux OOM Killer 在系统内存严重不足时被内核触发，目的是终止一个或多个进程以释放内存、防止系统完全僵死。它不是随机选进程杀，而是基于每个进程的 oom_score_adj 值和实际内存占用综合计算“OOM 优先级”，值越高越容易被选中。理解其触发逻辑并合理调优 oom_score_adj，是保障关键服务稳定性的重要运维手段。

OOM Killer 是如何被触发的？

当内核尝试分配内存（如通过 alloc_pages）但无法从 buddy system 或 slab 中获取足够页帧，且所有可回收内存（page cache、slab、swap 等）已基本耗尽时，会进入 OOM 流程。此时内核遍历所有用户态进程（忽略内核线程），为每个进程计算一个 badness 分数：

基础分 = 进程 RSS + Swap 使用量（单位：页）
再乘以 oom_score_adj 归一化系数（范围 -1000 ~ +1000；-1000 表示永不 kill，0 是默认值，+1000 表示最优先 kill）
最后除以总可用内存页数做归一化，得到最终 badness

分数最高的进程被选中并发送 SIGKILL。注意：OOM 并不依赖 swap 是否启用，即使禁用 swap，只要物理内存彻底耗尽，同样会触发。

oom_score_adj 的作用与合法取值

/proc/[pid]/oom_score_adj 是用户可控的接口，用于显式影响 OOM 评分权重。它不是直接设置“分数”，而是调节内核对进程内存“危害性”的判定倾向：

OneStory

OneStory 是一款创新的AI故事生成助手，用AI快速生成连续性、一致性的角色和故事。

下载

-1000：进程被标记为 OOM-immune，内核跳过该进程（需 CAP_SYS_RESOURCE 权限）
0：默认值，按实际内存使用参与评分
+500 ~ +1000：适合短命、高内存波动但非关键的进程（如编译任务、临时脚本）
-500 ~ -999：适合长期运行、低内存但不可中断的关键服务（如数据库主进程、容器 runtime）

注意：oom_score_adj 不改变进程真实内存占用，也不阻止其他机制（如 cgroup memory limit）的限制行为。

生产环境调优建议

盲目设 -1000 存在风险——若关键进程本身内存泄漏，可能拖垮整个系统。推荐分层策略：

容器场景：在 docker run 或 Pod spec 中使用 --oom-score-adj（Docker）或 securityContext.oomScoreAdj（Kubernetes），避免手动改 /proc
systemd 服务：在 service unit 文件中添加 OOMScoreAdjust=-500，比启动后 echo 更可靠
监控先行：定期采集 /proc/*/oom_score 和 /proc/*/status 中的 MMU、RSS 字段，结合 dmesg -T | grep -i "killed process" 定位被杀原因
避免全局设死值：同一类服务在不同负载下内存表现不同，应结合 cgroup v2 memory.max + memory.low 做更精细的资源隔离

常见误区与验证方法

很多人误以为调低 oom_score_adj 就能“保命”，但忽略了根本矛盾在于内存是否真的够用：

误区：给 MySQL 设 -1000 后仍被 kill → 实际可能是其子进程（如备份脚本、UDF）未设限，或内核因 page cache 耗尽而误判
验证命令：cat /proc/$(pgrep mysqld)/oom_score_adj 查当前值；grep -i "out of memory" /var/log/kern.log 看完整 OOM 日志
调试技巧：临时用 echo -500 > /proc/$(pidof nginx)/oom_score_adj 测试效果，观察后续 OOM 是否转向其他进程

真正健壮的方案，是把 oom_score_adj 当作最后一道保险，而非替代内存容量规划、泄漏排查和 cgroup 配额管理。

Linux 生产环境运维经验总结

Linux nftables 的 nat masquerade vs iptables 的 SNAT/DNAT 性能对比 2026

Linux服务器端口扫描_端口暴露风险分析

Linux云平台迁移风险_迁移评估与验证

Linux循环怎么写_Shell循环教程

相关专题

mysql修改数据表名

MySQL修改数据表：1、首先查看数据库中所有的表，代码为：‘SHOW TABLES；’；2、修改表名，代码为：‘ALTER TABLE 旧表名 RENAME [TO] 新表名；’。php中文网还提供MySQL的相关下载、相关课程等内容，供大家免费下载使用。

684

2023.06.20

MySQL创建存储过程

存储程序可以分为存储过程和函数，MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名)，也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容，供大家免费下载使用。

472

2023.06.21

mongodb和mysql的区别

mongodb和mysql的区别：1、数据模型；2、查询语言；3、扩展性和性能；4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容，供大家免费下载体验。

287

2023.07.18

mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统，由瑞典MySQL AB 公司开发，属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一，在 WEB 应用方面，MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

519

2023.07.19

mysql创建数据库

MySQL是一个关系型数据库管理系统，由瑞典MySQL AB 公司开发，属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一，在 WEB 应用方面，MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

265

2023.07.25

mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统，它支持事务处理。事务是一组数据库操作，它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性，MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

392

2023.08.08

sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途，但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

542

2023.08.11

mysql忘记密码

MySQL是一种关系型数据库管理系统，关系数据库将数据保存在不同的表中，而不是将所有数据放在一个大仓库内，这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢？php中文网给大家带来了相关的教程以及其他关于mysql的文章，欢迎大家前来学习阅读。

665

2023.08.14

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

2026.03.05

热门下载

网站特效

网站源码

网站素材

前端模板