0

0

Python Kubernetes 的 HPA 配置

冷漠man

冷漠man

发布时间:2026-02-16 15:45:11

|

532人浏览过

|

来源于php中文网

原创

targetaverageutilization仅适用于cpu/memory资源指标(百分比),targetaveragevalue用于自定义/外部指标(具体数值);混用会导致hpa无法获取指标而失败。

python kubernetes 的 hpa 配置

HPA 里 targetAverageUtilizationtargetAverageValue 别混用

这两个参数看着像一对,其实语义完全不同:前者只对 CPUmemory 这类资源指标生效,且是百分比(比如 70 表示 70% 的 request);后者才是通用数值型目标,比如你想让 Pod 平均每秒处理 100 个请求,就得用 targetAverageValue: 100,还得配 metricNamemetrics 字段。

常见错误现象:targetAverageUtilization 被误用于自定义指标(如 http_requests_total),结果 HPA 一直报 failed to get cpu utilization 或直接不拉伸——它压根不认这个字段。

  • 用 CPU/memory → 优先选 targetAverageUtilization,写法简单、兼容性好(所有 K8s 版本都支持)
  • 用自定义指标或外部指标 → 必须弃用 targetAverageUtilization,改用 metrics 数组 + targetAverageValuetargetValue
  • K8s v1.23+ 开始,autoscaling/v2beta2 已废弃,统一用 autoscaling/v2,字段结构有变化,老配置直接 apply 会失败

Python 应用暴露指标前,先确认 metrics-server 能抓到你的 Pod

HPA 不读 Prometheus,它默认只认 metrics-server 提供的 cpumemory。如果你的 Python 服务加了 prometheus-client 暴露 /metrics,但没装 prometheus-adapter,HPA 就完全看不到那些自定义指标。

验证方法很简单:运行 kubectl top pods。如果返回空或报错 unable to fetch metrics,说明 metrics-server 没跑起来,或者你的 Pod 没设 resources.requests(它依赖 requests 计算利用率)。

立即学习Python免费学习笔记(深入)”;

Selenium+Python配置 中文WORD版
Selenium+Python配置 中文WORD版

本文档主要讲述的是Selenium+Python配置;希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看

下载
  • 必须给容器加 resources.requests,哪怕只是 cpu: 100m,否则 targetAverageUtilization 算不出百分比
  • metrics-server 默认不采集自定义指标,别指望它能读你 Python 的 http_requests_total
  • 想用自定义指标?得部署 prometheus-adapter,并确保它的 rules 正确把 Prometheus 查询映射成 HPA 可识别的 metric name

HPA 的 minReplicasmaxReplicas 不是“安全区”,而是硬边界

很多人以为设了 minReplicas: 2 就能防止单点故障,其实不是:当负载极低时,HPA 会缩到 2,但若整个 Deployment 只剩一个可用 Pod(比如滚动更新中),HPA 不会干预——它只管扩缩,不管可用性。

更关键的是,minReplicas 会影响 HPA 的初始行为。如果刚创建 HPA 时 Pod 还没就绪,它可能卡在 Unknown 状态,直到第一个 Pod Ready 并上报指标。

  • minReplicas 设太小(比如 1),遇到瞬时毛刺可能反复扩缩,尤其 Python 启动慢,新 Pod 还没 ready 就又缩容了
  • maxReplicas 不是性能上限,而是你愿为这服务付多少成本的红线;超过后 HPA 直接拒绝扩容,不会报警也不会降级
  • 别依赖 HPA 保活,健康检查(livenessProbe)和滚动更新策略(maxUnavailable)才是防宕机的关键

kubectl get hpa 看状态时,UNKNOWN0%/70% 含义差很远

UNKNOWN 表示 HPA 根本没拿到任何指标数据——可能是 metrics-server 挂了、Pod 没 ready、指标名拼错,或者权限没给够(system:auth-delegator 角色缺失)。而 0%/70% 是正常态,表示当前利用率是 0%,目标是 70%,HPA 在等负载上来。

查不到数据时,别急着调参数。先跑 kubectl describe hpa <code>your-hpa-name,重点看 Events 里最后一行是不是 failed to get memory utilization 或类似提示。

  • Events 里出现 did not receive metrics for any ready pods → 检查 Pod 是否处于 Running + Ready 状态
  • 出现 unable to get metrics for resource cpumetrics-server 连不上 kubelet,查其日志(kubectl logs -n kube-system deployment/metrics-server
  • 看到 no metrics returned from custom metrics APIprometheus-adapter 的 service 或 APIService 配置有问题

HPA 的延迟和抖动比想象中大:从指标采集、HPA controller 轮询(默认 15 秒)、到 Deployment 扩容(镜像拉取 + 启动),整个链路轻松超过 1 分钟。别拿它当实时响应工具,尤其是 Python 这种启动慢的服务。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
resource是什么文件
resource是什么文件

Resource文件是一种特殊类型的文件,它通常用于存储应用程序或操作系统中的各种资源信息。它们在应用程序开发中起着关键作用,并在跨平台开发和国际化方面提供支持。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

167

2023.12.20

Golang云原生微服务Kubernetes_Golang怎么集成Kubernetes开发云原生服务
Golang云原生微服务Kubernetes_Golang怎么集成Kubernetes开发云原生服务

Golang云原生微服务Kubernetes (K8s) 是指 使用 Go 语言(Golang)编写的云原生微服务,并利用 Kubernetes 平台进行容器化部署、自动化管理、弹性伸缩和高效编排的一整套现代应用架构方案。

27

2025.12.22

Golang云原生微服务Kubernetes_Golang怎么集成Kubernetes开发云原生服务
Golang云原生微服务Kubernetes_Golang怎么集成Kubernetes开发云原生服务

Golang云原生微服务Kubernetes (K8s) 是指 使用 Go 语言(Golang)编写的云原生微服务,并利用 Kubernetes 平台进行容器化部署、自动化管理、弹性伸缩和高效编排的一整套现代应用架构方案。

27

2025.12.22

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

249

2026.02.13

微博网页版主页入口与登录指南_官方网页端快速访问方法
微博网页版主页入口与登录指南_官方网页端快速访问方法

本专题系统整理微博网页版官方入口及网页端登录方式,涵盖首页直达地址、账号登录流程与常见访问问题说明,帮助用户快速找到微博官网主页,实现便捷、安全的网页端登录与内容浏览体验。

118

2026.02.13

Flutter跨平台开发与状态管理实战
Flutter跨平台开发与状态管理实战

本专题围绕Flutter框架展开,系统讲解跨平台UI构建原理与状态管理方案。内容涵盖Widget生命周期、路由管理、Provider与Bloc状态管理模式、网络请求封装及性能优化技巧。通过实战项目演示,帮助开发者构建流畅、可维护的跨平台移动应用。

38

2026.02.13

TypeScript工程化开发与Vite构建优化实践
TypeScript工程化开发与Vite构建优化实践

本专题面向前端开发者,深入讲解 TypeScript 类型系统与大型项目结构设计方法,并结合 Vite 构建工具优化前端工程化流程。内容包括模块化设计、类型声明管理、代码分割、热更新原理以及构建性能调优。通过完整项目示例,帮助开发者提升代码可维护性与开发效率。

19

2026.02.13

Redis高可用架构与分布式缓存实战
Redis高可用架构与分布式缓存实战

本专题围绕 Redis 在高并发系统中的应用展开,系统讲解主从复制、哨兵机制、Cluster 集群模式及数据分片原理。内容涵盖缓存穿透与雪崩解决方案、分布式锁实现、热点数据优化及持久化策略。通过真实业务场景演示,帮助开发者构建高可用、可扩展的分布式缓存系统。

22

2026.02.13

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

29

2026.02.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 4.3万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号