如何在Golang中编写K8s自定义Scheduler Go语言扩展Kubernetes调度算法

P粉602998670

发布时间：2026-03-12 11:11:32

577人浏览过

来源于php中文网

原创

不能直接修改 default-scheduler 源码，因其为独立二进制，修改即维护 fork 分支，导致升级困难、安全滞后、无法享受调度框架演进；应通过编写外部调度器实现可维护扩展。

如何在golang中编写k8s自定义scheduler go语言扩展kubernetes调度算法

为什么不能直接修改 default-scheduler 的源码

Kubernetes 官方 default-scheduler 是一个独立的、编译好的二进制，它和 kube-apiserver 通过 watch + REST 交互。你改它的 Go 源码再编译，等于在维护一个 fork 分支——升级困难、安全补丁滞后、无法享受社区调度框架（如 scheduler framework）的演进红利。

真正可维护的做法是：用 Go 写一个**外部调度器（custom scheduler）**，监听未调度 Pod（Pod.Spec.NodeName == ""），调用调度逻辑，再 PATCH 或 UPDATE Pod 绑定到目标节点。

必须监听 Pod 资源的 Unscheduled phase（即 Pod.Status.Phase == "Pending" 且 Pod.Spec.NodeName == ""）
不能监听 Node 变化来触发调度——那是调度器的下游行为，不是起点
绑定操作必须用 schedulerclientset.SchedulingV1().Pods(pod.Namespace).Bind(context, bind, metav1.CreateOptions{})，而不是 PATCH；否则可能被 admission controller 拦截或绕过调度策略校验

如何用 client-go 正确监听 Pending Pod 并过滤未调度状态

很多人直接 list/watch 所有 Pod，结果发现大量已调度 Pod 也被拉下来，CPU 和内存白白浪费。关键在于：要组合两个条件过滤，不是只看 Phase == Pending。

Pod.Status.Phase == "Pending" 是必要但不充分条件——有些 Pending Pod 已经被其他调度器绑定了，只是 status 还没同步完
必须同时检查 Pod.Spec.NodeName == ""，这才是“真正待调度”的唯一可靠标志
推荐用 field selector：fieldSelector=spec.nodeName==,status.phase=Pending，比在内存里遍历过滤更省资源
注意 client-go 的 Informer 默认不缓存 status 字段的全部内容，确保你用的是 cache.NewSharedIndexInformer + podInformer.Lister().Pods(ns).Get(name) 获取最新状态

示例片段：

SophNet

专业的AI开发工具平台，让AI集成变得简单高效。

下载

立即学习“go语言免费学习笔记（深入）”；

listOptions := metav1.ListOptions{
    FieldSelector: "spec.nodeName==,status.phase=Pending",
}
podInformer := cache.NewSharedIndexInformer(
    &cache.ListWatch{
        ListFunc: func(options metav1.ListOptions) (runtime.Object, error) {
            return clientset.CoreV1().Pods(metav1.NamespaceAll).List(context.TODO(), listOptions)
        },
        WatchFunc: func(options metav1.ListOptions) (watch.Interface, error) {
            return clientset.CoreV1().Pods(metav1.NamespaceAll).Watch(context.TODO(), listOptions)
        },
    },
    &corev1.Pod{},
    0,
    cache.Indexers{},
)

调度决策后如何安全完成 Bind 操作

写完调度算法选出 nodeName，下一步不是 PATCH Pod，也不是直接改 Spec.NodeName——那会绕过调度框架的 binding cycle，导致 Pod.Status.Conditions 缺失 Scheduled=True，后续 controller（如 daemonset controller）可能反复干扰。

必须使用 scheme.Scheme.Convert() 将 v1.Binding 对象转成 schedulingv1.Binding（K8s 1.22+ 强制要求）
Binding 对象的 Target.Name 必须是真实存在的 Node 名（大小写敏感），且该 Node 的 Status.Conditions 中 Type=="Ready" 的 Status=="True"
如果用 clientset.CoreV1().Pods(pod.Namespace).Bind()，需传入 metav1.CreateOptions{}，不能传空 struct；否则某些版本 API server 会返回 405 Method Not Allowed
Bind 失败常见错误：Binding not allowed for namespaced object —— 表明你用了 corev1.Binding 而不是 schedulingv1.Binding

为什么你的 custom scheduler 启动后没反应

最常被忽略的点：RBAC 权限不全，或者没开 --authentication-token-webhook 和 --authorization-mode=Node,RBAC（尤其在 minikube 或 kind 集群中默认关了 webhook）。

ServiceAccount 至少需要：get/list/watch on pods，get/watch on nodes，create on bindings（注意是 scheduling.k8s.io/v1 组）
ClusterRole 示例中漏掉 resourceNames 不影响，但漏掉 verbs: ["create"] on bindings 就完全 bind 不了
本地调试时，用 kubectl auth can-i create bindings --namespace=default --as=system:serviceaccount:default:my-scheduler-sa 快速验证权限
如果日志里只有 “no events received”，八成是 Informer 没 start，检查是否忘了调 informer.Run(stopCh)

调度器不是写完就能跑的服务，它高度依赖集群侧的配置对齐。哪怕算法逻辑 100% 正确，缺一个 create bindings 权限，它就永远卡在 pending 状态——而且不会报错，只会静默跳过。

如何在Golang中优化Protobuf序列化CPU占用 Go语言Gogoprotobuf库

如何在Golang中优雅地处理错误 Go语言if err != nil最佳实践

Golang中的项目文档godoc本地生成技巧 Go语言代码注释规范

Golang中的集成测试数据库容器化方案 Go语言Testcontainers库应用

如何在Golang中利用IO多路复用提升性能 Go语言底层epoll机制简述

相关标签:

go golang go语言 kubernetes golang Object for Token Struct Namespace Go语言对象 default 算法 kubernetes kind

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Go 语言中通过通信共享资源的核心机制解析：理解无限轮询背后的通道行为下一篇：如何在Golang中实现微服务的配置热加载 Go语言Viper与Consul Watch

作者最新文章

mysql如何使用加密与解密函数_mysql md5/sha2/aes_encrypt

2026-03-12 11:13

如何在Java中过滤List中的空值_Stream.filter与Objects.nonNull结合

2026-03-12 11:13

Golang指针基础：什么时候该使用指针 Go语言指针传递性能评估

2026-03-12 11:14

CSS如何实现带有粒子感的按钮点击过渡_结合伪元素与transition动画配合

2026-03-12 11:14

CSS如何实现带自适应文本的圆形标签_通过Aspect-ratio固定比例css

2026-03-12 11:15

如何在Golang中利用Build Tags实现按需编译 Go语言条件编译文件名规则

2026-03-12 11:15

Django怎么跑起来_runserver命令与本地开发服务器启动

2026-03-12 11:16

CSS如何实现多层重叠的卡片布局_通过逐级增加z-index与relative偏移

2026-03-12 11:17

NumPy如何按权重抽样_np.random.choice()的p参数设置概率分布

2026-03-12 11:17

大型复杂数据库如何进行逻辑模型转为物理模型_模块化管理方案

2026-03-12 11:16

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

golang如何定义变量

golang定义变量的方法：1、声明变量并赋予初始值“var age int =值”；2、声明变量但不赋初始值“var age int”；3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

210

2024.02.23

golang有哪些数据转换方法

golang数据转换方法：1、类型转换操作符；2、类型断言；3、字符串和数字之间的转换；4、JSON序列化和反序列化；5、使用标准库进行数据转换；6、使用第三方库进行数据转换；7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

247

2024.02.23

golang常用库有哪些

golang常用库有：1、标准库；2、字符串处理库；3、网络库；4、加密库；5、压缩库；6、xml和json解析库；7、日期和时间库；8、数据库操作库；9、文件操作库；10、图像处理库。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

356

2024.02.23

golang和python的区别是什么

golang和python的区别是：1、golang是一种编译型语言，而python是一种解释型语言；2、golang天生支持并发编程，而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

214

2024.03.05

golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型，并具有垃圾回收功能的开源编程语言，采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

409

2024.05.21

golang结构体相关大全

本专题整合了golang结构体相关大全，想了解更多内容，请阅读专题下面的文章。

490

2025.06.09

golang相关判断方法

本专题整合了golang相关判断方法，想了解更详细的相关内容，请阅读下面的文章。

201

2025.06.10

golang数组使用方法

本专题整合了golang数组用法，想了解更多的相关内容，请阅读专题下面的文章。

1458

2025.06.17

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板