0

0

Linux 进程调度器的工作原理解析

舞夢輝影

舞夢輝影

发布时间:2026-01-29 11:42:09

|

725人浏览过

|

来源于php中文网

原创

Linux进程调度器按实时优先于普通、同级按vruntime最小原则选择下一个进程:实时进程(SCHED_FIFO/RR/DEADLINE)独占调度优先权;普通进程由CFS通过红黑树取最小vruntime节点实现长期公平。

linux 进程调度器的工作原理解析

进程调度器怎么决定“下一个该谁上 CPU”

Linux 不是随机挑一个进程来跑,而是按优先级+公平性双重逻辑筛选。核心原则是:实时进程(SCHED_FIFO/SCHED_RR/SCHED_DEADLINE)永远优先于普通进程;同属普通进程时,CFS 调度器通过 vruntime(虚拟运行时间)决定谁更“饿”。vruntime 越小,说明这个进程实际分到的 CPU 时间越少,就越该被调度——它被维护在红黑树最左端,调度器直接取树头节点,O(log n) 时间完成选择。

  • 每个 CPU 有独立的运行队列 struct rq,里面分两个子队列:rt_rq(放实时进程)和 cfs_rq(放普通进程)
  • 调度器按 sched_class 优先级顺序调用:先调 rt_sched_classrt_rq,没活干才轮到 fair_sched_classcfs_rq
  • stop_sched_class 是隐藏 Boss,只用于迁移线程或 CPU 热插拔等内核关键操作,用户态进程根本碰不到

为什么改 nice 值不总能立刻见效

因为 nice 只影响 CFS 中的权重计算,不改变进程类别,也不影响实时进程。它的作用路径是:nice → load.weight → vruntime 增长速率。负 nice(如 -10)让进程获得更高权重,vruntime 增长得慢,更容易被选中;正 nice(如 +15)则相反。

  • nice 范围是 -20 到 19,但普通用户只能调高(即设为 0–19),只有 root 才能设负值
  • 改完 nice 后,进程不会“插队”,只是下次调度周期里获得更大/更小的 CPU 时间份额
  • 对已绑定到某 CPU 的实时进程(如用 taskset -c 0 + chrt -f 50 启动),nice 完全无效——它只作用于 SCHED_NORMAL 类进程

CFS 调度器里的“时间片”其实不存在

很多人误以为 CFS 和老式轮转法一样靠固定时间片切进程,其实它压根不维护时间片。CFS 动态计算每个进程的“理想运行时间”,公式近似为:ideal_time = (cpu_period × weight) / total_weight。这个值随就绪进程数、权重变化实时浮动——所以你看到 top 里 %CPU 波动剧烈,不是调度器不准,而是它本就不承诺“均分毫秒级时间片”。

AGI-Eval评测社区
AGI-Eval评测社区

AI大模型评测社区

下载
  • 默认 sysctl -w kernel.sched_latency_ns=6000000(6ms),这是 CFS 尝试在一个调度周期内调度完所有可运行进程的目标窗口
  • 当就绪进程太多(比如 > 80 个),CFS 会自动缩短单次运行时间,避免某个进程长期得不到响应
  • 不要手动调小 kernel.sched_min_granularity_ns 来“提高响应”,这反而会加剧上下文切换开销,实测可能让吞吐下降 10%+

实时进程抢占普通进程的边界在哪

实时进程能立即抢占普通进程,但不能抢占另一个更高优先级的实时进程,也不能抢占内核临界区(比如正在执行自旋锁保护的代码)。最关键的是:实时进程一旦开始运行,就会一直跑到自己主动让出(如 sleep、阻塞 I/O)或被更高优先级实时进程打断为止——没有“时间片用完强制切走”这回事。

  • chrt -f 99 启动的 FIFO 进程,若进入死循环且不 yield,会彻底霸占所在 CPU,连内核线程都可能被饿死
  • SCHED_RR 有隐含时间片(默认 100ms),超时后自动移到同优先级队列尾部,但依然不保证其他普通进程能插进来——只要还有同优先级 RR 进程就绪,它就继续轮
  • 检查是否真被抢占:用 perf sched latency -s max 看最高调度延迟,若 > 100μs 且集中在某进程,大概率是它没 yield 或绑核太死
CFS 的公平是“长期统计意义下的公平”,不是“每毫秒都平均”;实时调度的确定性依赖你完全掌控进程行为——这两点一旦混淆,调优就容易南辕北辙。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

503

2023.08.10

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1395

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

706

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

295

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

782

2023.07.05

linux系统安装教程
linux系统安装教程

linux系统是一种可以免费使用,自由传播,多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章,大家可以免费体验。

575

2023.07.06

linux查看文件夹大小
linux查看文件夹大小

Linux是一种自由和开放源码的类Unix操作系统,存在着许多不同的Linux版本,但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中,比如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机。linux怎么查看文件夹大小呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

550

2023.07.20

linux查看ip命令
linux查看ip命令

本专题为大家提供linux查看ip命令相关文章内容,感兴趣的朋友可以免费下载体验试试。

300

2023.07.20

clawdbot ai使用教程 保姆级clawdbot部署安装手册
clawdbot ai使用教程 保姆级clawdbot部署安装手册

Clawdbot是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

19

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8万人学习

Git 教程
Git 教程

共21课时 | 3.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号