Linux Descheduler 的 Pod 驱逐策略与低利用率节点优化

冰川箭仙

发布时间：2026-02-21 17:23:02

940人浏览过

来源于php中文网

原创

descheduler 默认策略不驱逐低利用率节点上的 pod，因其不感知实时资源使用率，且lownodeutilization默认禁用、依赖metrics server采样、基于requests而非usage判断。

linux descheduler 的 pod 驱逐策略与低利用率节点优化

Descheduler 默认策略为什么不会驱逐低利用率节点上的 Pod

Descheduler 不是资源调度器，它只做“重新平衡”或“清理”，不感知节点 CPU/MEM 实时使用率。默认策略如 RemoveDuplicates、LowNodeUtilization 中的 LowNodeUtilization 确实面向低利用率场景，但它依赖的是 Descheduler 自己采样的指标（通过 Metrics Server），且必须显式启用——它不会自动开火。

LowNodeUtilization 默认是禁用的，配置里不写就等于没开
它不读取 top 或 node_exporter 数据，只认 Metrics Server 的 /apis/metrics.k8s.io/v1beta1/nodes 返回值
采样有延迟（默认 60s 间隔），若节点刚变空闲，Descheduler 可能还没拿到新数据
阈值判断基于“请求量（requests）占比”，不是实际用量（usage）；哪怕 Pod 只用了 5% CPU，只要它 request 了 4 核，该节点就算“高负载”

如何正确配置 LowNodeUtilization 触发驱逐

关键在三处：启用策略、配准阈值、确保 Metrics Server 可达。缺一不可。

在 Descheduler 配置中显式声明 strategies，不能只靠注释或默认值
thresholds 必须同时设 cpu 和 memory，即使只关心 CPU；未设置的资源会被跳过判断
targetThresholds 要比 thresholds 更宽松（例如 thresholds 是 20%，targetThresholds 至少设 40%），否则找不到“可迁入”的目标节点，驱逐会失败
确认 Metrics Server 正常运行：kubectl get --raw "/apis/metrics.k8s.io/v1beta1/nodes" | jq '.items[].usage'

strategies:
  "LowNodeUtilization":
    enabled: true
    params:
      thresholds:
        cpu: 20
        memory: 20
      targetThresholds:
        cpu: 50
        memory: 50
      evictableNamespaces:
        exclude:
        - kube-system
        - descheduler

驱逐后 Pod 为什么卡在 Pending 状态

这不是 Descheduler 的问题，而是调度器找不到合适节点——常见于资源 request/limit 设得过高，或节点 taint 未兼容。

MakeLogo AI

AI驱动的Logo生成器

下载

被驱逐的 Pod 带着原 resources.requests 重新进调度队列，若集群没有单节点能容纳这个 request，就会 Pending
检查是否误加了 nodeSelector 或 affinity，导致只剩 1–2 个节点可选
确认目标节点没有 NoSchedule taint，或 Pod 没带对应 tolerations
Descheduler 不修改 Pod，也不触发 Horizontal Pod Autoscaler（HPA）；如果想缩容，得另配 HPA 或手动调低 replicas

和 Cluster Autoscaler 配合时要注意什么

Descheduler 和 Cluster Autoscaler 是上下游关系，但节奏不同步容易引发“驱逐-扩容-再驱逐”循环。

Descheduler 默认每 5 分钟跑一次，Cluster Autoscaler 扩容通常需 1–3 分钟；若 Descheduler 在 CA 扩容完成前反复驱逐，可能把 Pod 全赶到新节点上，又立刻因低利用率再驱离
建议给 CA 设置 --scale-down-delay-after-add=10m，让新节点有足够时间“接活”
Descheduler 的 PodLifeTime 策略可配合使用：避免刚调度上去的 Pod 立刻被踢，加个 maxPodLifeTimeSeconds: 300
不要在同一个命名空间里混用 LowNodeUtilization 和 RemovePodsViolatingInterPodAntiAffinity 等激进策略，容易叠加放大震荡

低利用率判断本身依赖采样精度和阈值粒度，而真实业务负载常有脉冲特征。哪怕配置全对，也可能出现“刚驱完，监控曲线就跳起来”的情况——这时候与其调低阈值，不如先看 Pod request 是否合理。

Linux skopeo copy / inspect / delete 的镜像仓库管理实践

Linux rpm 软件包管理技巧

Linux inode 与文件系统性能关系

Linux cgroups v2 在 systemd 与容器运行时的统一迁移路径

Linux LVM 管理与快照使用技巧

相关标签:

linux 命名空间循环 linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux /proc/net/softnet_stat 的 softirq 统计与网络中断负载均衡下一篇：Linux 编译安装源码软件实践

作者最新文章

Python 缺失值填充策略的业务选择

2026-02-19 12:34

手机淘宝删除订单记录怎么找回来？手机淘宝删除的订单信息怎么找回

2026-02-19 12:34

没带手机微信电脑版怎么登陆微信电脑版无手机登录解决办法

2026-02-19 13:15

Linux 日志集中收集与分析方法

2026-02-19 13:19

edge怎么设置成中文语言首选项与界面语言切换

2026-02-19 13:29

微信电脑版手机操作微信电脑版手机操作说明

2026-02-19 13:30

GitHub 仓库怎么删除文件？仓库文件删除操作说明

2026-02-19 13:37

SQL 复杂报表生成 SQL 方法

2026-02-19 13:45

腾讯会议声音怎么调设置

2026-02-19 14:07

SQL checkpoint_completion_target 0.9 的检查点平滑分布实践

2026-02-19 14:24

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制，就是管理员可以为用户所能使用的磁盘空间进行配额限制，每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容，教程，供大家免费下载安装。

1520

2023.06.21

如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章，还有相关的下载、课程，大家可以免费体验。

715

2023.06.29

linux find

find是linux命令，它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合，只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression，在命令列上第一个 - ( ) , ! 之前的部分为 path，之后的是 expression。还有指DOS 命令 find，Excel 函数 find等。本站专题提供linux find相关教程文章，还有相关

300

2023.06.30

linux修改文件名

本专题为大家提供linux修改文件名相关的文章，这些文章可以帮助用户快速轻松地完成文件名的修改工作，大家可以免费体验。

791

2023.07.05

linux系统安装教程

linux系统是一种可以免费使用，自由传播，多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章，大家可以免费体验。

584

2023.07.06

linux查看文件夹大小

Linux是一种自由和开放源码的类Unix操作系统，存在着许多不同的Linux版本，但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中，比如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机。linux怎么查看文件夹大小呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

563

2023.07.20