0

0

Linux cilium status / cilium-health 的集群健康检查清单

舞夢輝影

舞夢輝影

发布时间:2026-02-20 16:12:10

|

108人浏览过

|

来源于php中文网

原创

cilium status可快速判断集群核心组件是否存活,需在cilium pod内执行,重点检查cilium、operator、hubble三行状态,任一非ok或超时即表明节点网络/ebpf异常。

linux cilium status / cilium-health 的集群健康检查清单

如何用 cilium status 快速判断集群是否“活着”

它不是万能诊断器,但能一眼揪出最致命的组件掉线——比如 cilium-agent 没起来、cilium-operator 崩了、或者 Hubble 服务不可达。cilium status 走的是本地 agent 的健康端点,不依赖 Kubernetes API Server,所以即使控制面卡住,它也可能显示 OK;但反过来,如果它报错,基本说明节点网络栈或 eBPF 加载已出问题。

  • 必须在任意一个 cilium Pod 内执行:kubectl -n kube-system exec -ti <cilium-pod-name> -- cilium status</cilium-pod-name>,直接在宿主机跑会失败(缺少 socket 和权限)
  • 关键看三行:Cilium(agent)、Operator(controller)、Hubble(可观测性),任一不是 OK 都得立刻查日志
  • 如果输出卡住或超时,大概率是 BPF map 初始化失败,常见于内核版本太低(5.4 以下)、SELinux 启用未配置、或 /sys/fs/bpf 挂载异常

cilium-health 是什么,为什么不能只靠它看“全集群”健康

cilium-health 是每个节点上独立运行的探测进程,专做节点间连通性打点:它会主动向其他所有节点的 cilium-health 端口(默认 4240)发 HTTP GET /healthz,并记录延迟与成功率。但它不检查 Pod 网络、策略、DNS 或服务发现——只管“节点能不能 ping 通另一节点的健康端口”。

  • 它默认只探测同集群内节点,跨 ClusterMesh 的健康状态要额外配置 cluster-mesh-health-check-interval
  • 探测失败不等于业务不通:可能只是防火墙拦了 4240 端口,而实际流量走的是 eBPF redirect,完全绕过该端口
  • 查看结果用:cilium-health status(在 Pod 内),或 kubectl -n kube-system get cep -o widecilium-health 对应的 endpoint 状态

连通性测试跑完全是 Connection refused 怎么办

官方 connectivity-check.yaml 里一堆 pod-to-b-intra-node-hostport 类型的测试失败,报 curl: (7) Failed to connect to echo-b-host-headless port 40000: Connection refused,这几乎从不意味着 Cilium 本身坏了,而是目标容器根本没监听那个端口,或者 readiness probe 没通过导致 kubelet 拒绝转发。

阿里云AI平台
阿里云AI平台

阿里云AI平台

下载
  • 先确认测试 Pod 是否真在 Running + Ready:kubectl get pods -n cilium-test -o wide,注意 READY 列是不是 1/1
  • 进失败 Pod 手动 curl:kubectl -n cilium-test exec -ti <failed-pod> -- curl -v http://echo-b-host-headless:40000</failed-pod>,看是 DNS 解析失败、连接超时,还是真被拒绝
  • 如果是 HostPort 测试失败,检查节点是否开了 hostPort 支持(--enable-hostports 参数需开启,且 Docker/containerd 配置允许)

真正有用的健康检查组合拳

单靠一个命令永远不够。生产环境要交叉验证三层:组件存活、节点连通、业务可达。漏掉任何一层,都可能线上炸锅还查不出原因。

  • 组件层:cilium status + kubectl -n kube-system get ds,deploy -l io.cilium/app 确认副本数和就绪数一致
  • 节点层:cilium-health status --verbose 查每个 peer 的 RTT 和失败次数;再配合 cilium endpoint list | grep -E "(not-ready|regenerating)" 找卡住的 endpoint
  • 业务层:别只信 connectivity-check,自己写个最小化测试 Job,用 busybox 访问核心 Service(如 kubernetes.default.svc.cluster.local),并加 --resolve 强制走 CoreDNS

最容易被忽略的是:cilium-health 探测间隔默认 30 秒,但故障转移策略(比如 ClusterMesh failover)可能设成 10 秒超时——这意味着健康探测还没来得及上报失败,流量就已经切走了。调参必须对齐。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

452

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

181

2023.10.30

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

420

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

594

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

420

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

594

2023.08.10

golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

77

2025.09.05

golang map相关教程
golang map相关教程

本专题整合了golang map相关教程,阅读专题下面的文章了解更多详细内容。

36

2025.11.16

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

776

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 9.4万人学习

Git 教程
Git 教程

共21课时 | 3.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号