0

0

systemd-oomd 杀错进程或不杀的优先级 / score_adj 配置经验

舞夢輝影

舞夢輝影

发布时间:2026-01-29 20:35:45

|

492人浏览过

|

来源于php中文网

原创

systemd-oomd 杀错进程主因是 score_adj 未生效,常见于 ProtectProc 干扰、容器运行时重置、服务类型配置不当;oomd 不触发则多因 cgroup v2 未启用或进程未纳入 systemd 管理;其 kill 决策综合内存占用与 score_adj 加权计算,并非越负越安全。

systemd-oomd 杀错进程或不杀的优先级 / score_adj 配置经验

systemd-oomd 杀错进程:score_adj 被忽略的常见原因

systemd-oomd 不按预期调整进程 OOM score,多数是因为 score_adj 值未被真正应用。它只读取 /proc/$PID/oom_score_adj 的当前值,而该值可能被 systemd 服务配置、容器运行时(如 runc)、或进程自身调用 setpriority() / prctl(PR_SET_OOM_SCORE_ADJ, ...) 覆盖。

典型现象是:你给 mysqld.service 设置了 OOMScoreAdjust=-900,但 systemctl show mysqld | grep OOM 显示正确,cat /proc/$(pidof mysqld)/oom_score_adj 却是 0-1000 —— 这说明进程启动后又被重置了。

  • 检查是否启用了 ProtectProc=(尤其是 ProtectProc=yesprotectProc=strict),它会阻止子进程修改 /proc/$PID/oom_score_adj,但也可能干扰 systemd 写入
  • 容器场景下,runc 默认将 oom_score_adj 设为 -999;若容器内进程再调用 prctl,结果不可控
  • OOMScoreAdjust= 必须写在 service unit 的 [Service] 段,且服务需用 Type=simpleType=forking(非 Type=notify 启动后才 fork 的情况要小心主进程 PID 变更)

systemd-oomd 不触发杀进程:内存压力检测失效的配置盲区

systemd-oomd 默认只监控 cgroup v2 层级下的 memory.current 和 memory.low,若你的系统没启用 cgroup v2、或目标进程不在 systemd 管理的 scope/service 下(比如直接 nohup ./app & 启动),oomd 根本看不见它。

验证方式:systemctl status systemd-oomd 看是否 active;再执行 systemd-run --scope --scope-property=MemoryLow=1G sleep 300,然后 cat /sys/fs/cgroup/system.slice/systemd-run*.scope/memory.current 是否有数值变化。

MagickPen
MagickPen

在线AI英语写作助手,像魔术师一样在几秒钟内写出任何东西。

下载
  • 确保内核启动参数含 systemd.unified_cgroup_hierarchy=1(Debian/Ubuntu 22.04+ 默认开启,CentOS/RHEL 8/9 需手动确认)
  • 非 systemd 启动的进程,可手动绑定进 cgroup:echo $PID > /sys/fs/cgroup/mygroup/cgroup.procs,但 oomd 不会自动管理该 group,需配 OOMScoreAdjust= 到对应 scope unit
  • oomd 默认每 2 秒采样一次,若内存 spike 小于 500ms,可能漏判;可通过 OOMPolicy=continue + 日志观察 journalctl -u systemd-oomd -f 确认是否真没触发

调整 score_adj 的实际优先级逻辑:不是越负越安全

systemd-oomd 的 kill 决策不单看 oom_score_adj,而是综合 memory.currentmemory.pressureoom_score_adj 计算加权得分。一个 oom_score_adj = -900 但占了 80% 内存的进程,仍可能比 oom_score_adj = 0 占 5% 内存的进程先被杀——因为 oomd 优先选“释放内存最多且代价最小”的目标。

  • oom_score_adj 范围是 -1000 ~ +1000,-1000 表示永不 kill(仅限内核 OOM killer;systemd-oomd 会跳过 -1000,但 -999 仍可能被选中)
  • 建议保守设置:核心数据库设 OOMScoreAdjust=-800,缓存服务设 -500,批处理脚本设 +300,避免极端值导致调度器失去调节空间
  • 不要依赖 OOMScoreAdjust 把某个进程“绝对保命”,oomd 的设计哲学是“可控牺牲”,真到内存耗尽边缘,所有非 -1000 进程都可能被评估

验证和调试 systemd-oomd 行为的最小可行步骤

别靠猜,用三步快速定位问题出在哪一层:cgroup 可见性 → oomd 采样 → score_adj 生效链路。

  • 查进程归属:cat /proc/$PID/cgroup 看是否在 system.slice/xxx.service 下;不是?oomd 不管它
  • 查 oomd 日志:journalctl -u systemd-oomd --since "1 hour ago" | grep -E "(kill|score|memory)",关注 Choosing to kill process 后面的 PID 和 score
  • 查最终生效值:cat /proc/$PID/status | grep OOM(注意是 OOMScoreAdj 字段,不是 oom_score),这个才是 oomd 实际读的值

最常被忽略的是:systemd-oomd 的决策日志默认等级是 info,而很多系统把 journald 的 level=notice,导致关键 kill 日志被过滤掉——改 /etc/systemd/system.conf 中的 LogLevel=info 并重启 systemd-journald 才能看到全貌。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java break和continue
java break和continue

本专题整合了java break和continue的区别相关内容,阅读专题下面的文章了解更多详细内容。

258

2025.10.24

数据库三范式
数据库三范式

数据库三范式是一种设计规范,用于规范化关系型数据库中的数据结构,它通过消除冗余数据、提高数据库性能和数据一致性,提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

358

2023.06.29

如何删除数据库
如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构,作用包括:1、释放存储空间;2、确保数据的安全性;3、提高数据库的整体性能,加速查询和操作的执行速度。尽管删除数据库具有一些好处,但在执行任何删除操作之前,务必谨慎操作,并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构,无法回滚。

2082

2023.08.14

vb怎么连接数据库
vb怎么连接数据库

在VB中,连接数据库通常使用ADO(ActiveX 数据对象)或 DAO(Data Access Objects)这两个技术来实现:1、引入ADO库;2、创建ADO连接对象;3、配置连接字符串;4、打开连接;5、执行SQL语句;6、处理查询结果;7、关闭连接即可。

349

2023.08.31

MySQL恢复数据库
MySQL恢复数据库

MySQL恢复数据库的方法有使用物理备份恢复、使用逻辑备份恢复、使用二进制日志恢复和使用数据库复制进行恢复等。本专题为大家提供MySQL数据库相关的文章、下载、课程内容,供大家免费下载体验。

256

2023.09.05

vb中怎么连接access数据库
vb中怎么连接access数据库

vb中连接access数据库的步骤包括引用必要的命名空间、创建连接字符串、创建连接对象、打开连接、执行SQL语句和关闭连接。本专题为大家提供连接access数据库相关的文章、下载、课程内容,供大家免费下载体验。

326

2023.10.09

数据库对象名无效怎么解决
数据库对象名无效怎么解决

数据库对象名无效解决办法:1、检查使用的对象名是否正确,确保没有拼写错误;2、检查数据库中是否已存在具有相同名称的对象,如果是,请更改对象名为一个不同的名称,然后重新创建;3、确保在连接数据库时使用了正确的用户名、密码和数据库名称;4、尝试重启数据库服务,然后再次尝试创建或使用对象;5、尝试更新驱动程序,然后再次尝试创建或使用对象。

412

2023.10.16

vb连接access数据库的方法
vb连接access数据库的方法

vb连接access数据库方法:1、使用ADO连接,首先导入System.Data.OleDb模块,然后定义一个连接字符串,接着创建一个OleDbConnection对象并使用Open() 方法打开连接;2、使用DAO连接,首先导入 Microsoft.Jet.OLEDB模块,然后定义一个连接字符串,接着创建一个JetConnection对象并使用Open()方法打开连接即可。

411

2023.10.16

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

1

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 2万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 812人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号