0

0

K3s agent 心跳丢失导致节点 NotReady 但网络其实通的排查

舞夢輝影

舞夢輝影

发布时间:2026-01-19 18:06:08

|

980人浏览过

|

来源于php中文网

原创

心跳丢失但网络通畅,问题在于kubelet与控制面通信链路中间环节,需重点排查证书有效性、api server地址配置、容器运行时(pleg)健康状态及系统资源压力四类隐性故障。

k3s agent 心跳丢失导致节点 notready 但网络其实通的排查

心跳丢失却网络通畅,说明问题不在基础连通性,而在 Kubelet 与控制面的通信链路中间环节。重点排查证书、配置、运行时状态和资源压力这四类隐性故障。

检查 Kubelet 客户端证书是否有效

K3s agent 注册后依赖定期刷新的客户端证书向 server 发送心跳。证书过期或签名不匹配会导致心跳被拒绝,但 curl 测试 6443 端口仍可能返回 200(healthz 不校验证书)。

  • 执行 openssl x509 -in /var/lib/rancher/k3s/agent/pki/kubelet-client-current.pem -noout -dates 查看有效期
  • 若证书已过期,需重启 k3s agent 服务触发自动轮换;若轮换失败,检查 server 节点时间是否同步、CA 证书是否被意外替换
  • 对比 agent 和 server 上的 /var/lib/rancher/k3s/server/tls/client-ca.crt 内容是否一致

确认 Kubelet 是否真正连接到正确的 API Server

K3s agent 启动时会读取 /var/lib/rancher/k3s/agent/etc/k3s-agent-env环境变量中的 server 地址。错误的地址(如残留旧 IP、DNS 解析异常、代理配置干扰)会导致 Kubelet 持续尝试连接不可达端点,日志中出现 connection refusedi/o timeout,但本地 nc -zv 测试可能因防火墙放行而“看似通”。

AskAI
AskAI

无代码AI模型构建器,可以快速微调GPT-3模型,创建聊天机器人

下载
  • 运行 ps aux | grep k3s | grep server= 确认实际连接的目标
  • 在 agent 节点执行 curl -k https://<server-ip>:6443/api/v1/nodes/<node-name></node-name></server-ip>,观察是否返回 401(认证层通)还是 403/404(路由或权限问题)
  • 检查 /etc/rancher/k3s/config.yamlserver: 配置是否为当前可用 master 地址,避免写死已下线节点

验证容器运行时与 PLEG 健康状态

心跳上报由 Kubelet 主动发起,但前提是其内部 Pod Lifecycle Event Generator(PLEG)能正常工作。若 containerd 响应缓慢、镜像拉取卡住或存在大量僵尸容器,PLEG 会进入 not healthy 状态,Kubelet 将暂停上报节点状态,导致 NotReady。

  • 执行 sudo ctr containers list | wc -l 查看容器数量是否异常偏高(>500 可能影响性能)
  • 运行 sudo systemctl status containerd 确认运行时进程存活且无 restart 频繁记录
  • 查看 Kubelet 日志中是否有 PLEG is not healthyfailed to update node status 关键报错
  • 临时执行 sudo ctr namespaces listsudo ctr c ls -n k8s.io 判断命名空间和容器元数据是否可读

排查系统级资源与内核限制

内存不足、inode 耗尽或内核参数限制(如 fs.inotify.max_user_watches 过低)不会阻断 TCP 连接,但会让 Kubelet 无法完成文件监听、证书加载或事件处理,表现为心跳静默。

  • 检查 inode 使用率:df -i /var/lib/rancher/k3s,若使用率 >95%,清理旧日志或镜像
  • 查看内存压力:free -mcat /proc/meminfo | grep -E "MemAvailable|OomKill"
  • 确认 inotify 限制:cat /proc/sys/fs/inotify/max_user_watches,建议不低于 524288
  • 检查 dmesg 输出:dmesg -T | tail -20 是否有 OOM killer 杀掉 kubelet 或 containerd 的记录

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

454

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

183

2023.10.30

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2836

2024.08.16

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

1

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

21

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

106

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

50

2026.03.04

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

89

2026.03.03

C++高性能网络编程与Reactor模型实践
C++高性能网络编程与Reactor模型实践

本专题围绕 C++ 在高性能网络服务开发中的应用展开,深入讲解 Socket 编程、多路复用机制、Reactor 模型设计原理以及线程池协作策略。内容涵盖 epoll 实现机制、内存管理优化、连接管理策略与高并发场景下的性能调优方法。通过构建高并发网络服务器实战案例,帮助开发者掌握 C++ 在底层系统与网络通信领域的核心技术。

27

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
HTML5/CSS3/JavaScript/ES6入门课程
HTML5/CSS3/JavaScript/ES6入门课程

共102课时 | 7.3万人学习

前端基础到实战(HTML5+CSS3+ES6+NPM)
前端基础到实战(HTML5+CSS3+ES6+NPM)

共162课时 | 21.3万人学习

第二十二期_前端开发
第二十二期_前端开发

共119课时 | 13.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号