K3s embedded etcd 磁盘满导致写操作失败怎么安全清理

舞夢輝影

发布时间：2026-01-18 19:54:09

591人浏览过

来源于php中文网

原创

当k3s内置etcd因磁盘满触发mvcc: database space exceeded错误时，需先压缩历史版本、再碎片整理、最后解除告警；严禁直接删文件，须按revision生命周期操作，并配置自动压缩与扩容预防复发。

k3s embedded etcd 磁盘满导致写操作失败怎么安全清理

当 K3s 内置 etcd 因磁盘满触发 mvcc: database space exceeded 错误时，写操作会失败，集群可能进入只读或降级状态。这不是单纯删文件就能解决的问题，必须按 etcd 数据生命周期逻辑操作：先压缩历史版本、再整理碎片、最后解除告警，同时避免误删关键数据。

确认当前空间使用和 revision 状态

先快速判断是否真满、满到什么程度：

运行 ETCDCTL_API=3 etcdctl --endpoints=http://127.0.0.1:2379 --write-out=table endpoint status，查看 DBSize 和 IsLeader 字段；若 DBSize 接近或等于配额（默认 2GB），且状态栏显示 dbm full 或报警，则确认已满
获取最新 revision：rev=$(ETCDCTL_API=3 etcdctl --endpoints=http://127.0.0.1:2379 endpoint status --write-out=json | grep -o '"revision":[0-9]*' | grep -o '[0-9]*')，这个值将用于后续压缩

执行安全压缩与碎片整理

压缩不是删除键，而是清理旧版本的 MVCC 历史记录；defrag 是回收物理磁盘空间。二者缺一不可，顺序不能颠倒：

68爱写

专业高质量AI4.0论文写作平台，免费生成大纲，支持无线改稿

下载

先压缩：运行 ETCDCTL_API=3 etcdctl --endpoints=http://127.0.0.1:2379 compact $rev。注意：该命令仅保留 revision ≥ $rev 的版本，Kubernetes 对象的更新历史会被精简，但不会丢失当前状态
再整理：立即执行 ETCDCTL_API=3 etcdctl --endpoints=http://127.0.0.1:2379 defrag。这一步真正释放磁盘空间，耗时取决于数据量，期间 etcd 可能短暂响应变慢，但不中断服务
解除告警：ETCDCTL_API=3 etcdctl --endpoints=http://127.0.0.1:2379 alarm disarm，否则即使空间已释放，etcd 仍拒绝写入

针对性清理高增长路径（可选但推荐）

K3s 中 /registry/events/ 和 /registry/minions/ 等路径常因频繁事件或节点心跳产生大量键，可按前缀批量清理：

查事件数量：ETCDCTL_API=3 etcdctl --endpoints=http://127.0.0.1:2379 get --prefix /registry/events/ | wc -l，若远超千条，说明事件积压严重
清理旧事件：ETCDCTL_API=3 etcdctl --endpoints=http://127.0.0.1:2379 del --prefix /registry/events/。Kubernetes 本身不依赖长期事件存档，清理后控制器会重建必要事件
谨慎操作：/registry/pods/、/registry/nodes/ 等核心路径绝对不要用 --prefix 删除，否则导致集群失联

预防再次发生（必须做）

临时清理只能救急，K3s 启动参数需固化配置：

在 /etc/rancher/k3s/config.yaml 中添加：
etcd-experimental-backup-lease-duration: "60s"
etcd-quota-backend-bytes: 8589934592（即 8GB）
etcd-auto-compaction-retention: "1h"
重启 K3s：sudo systemctl restart k3s，新配置生效后，etcd 每小时自动压缩一次，并将上限提升至 8GB，大幅降低满盘风险
建议同步开启定期快照：etcd-snapshot-schedule-cron: "0 */6 * * *（每6小时）+ etcd-snapshot-dir: "/var/lib/rancher/k3s/server/db/snapshots"

html js 全局变量,JS定义全局变量

看完这篇项目设计规约！你应该就能构建良好的工程结构了

JavaScript 中的执行上下文和调用栈是什么

ubuntu js新手入门指南

ubuntu js如何优化用户体验

相关标签:

js json node kubernetes json auto var 对象事件 table database etcd kubernetes rancher http

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：multipath -ll 显示 active 但实际 IO 走单路径的常见配置错误下一篇：Linux 软件 RAID rebuild 非常慢的几种加速参数和注意事项

作者最新文章

潜水员戴夫海马体力恢复潜水员戴夫海马耐力回复方法

2026-03-06 11:17

mc.js秒玩1.8.8入口地址_MCJS1.8.8秒玩入口我的世界网页版免费

2026-03-06 11:49

工研院筹组学界、法人联合舰队！投入中长程技术发展

2026-03-06 12:11

Python抽象类怎么定义_abc模块使用

2026-03-06 12:44

Linux如何查看系统日志_journalctl使用教程

2026-03-06 13:01

Linux网络延迟高怎么办_traceroute定位问题

2026-03-06 13:12

Linux网络不通怎么排查_网络连通性诊断流程

2026-03-06 13:23

PHP 实现深度优先遍历算法

2026-03-06 13:47

SQL分页查询太慢_深度分页优化方案

2026-03-06 14:11

SQL联合索引怎么用_最左前缀原则详解

2026-03-06 14:11

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

453

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

546

2023.08.23

jquery怎么操作json

操作的方法有：1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”；3、“$.each(obj, callback)”；4、“$.ajax()”。更多jquery怎么操作json的详细内容，可以访问本专题下面的文章。

331

2023.10.13

go语言处理json数据方法

本专题整合了go语言中处理json数据方法，阅读专题下面的文章了解更多详细内容。

2025.09.10

discuz database error怎么解决

discuz database error的解决办法有：1、检查数据库配置；2、确保数据库服务器正在运行；3、检查数据库表状态；4、备份数据；5、清理缓存；6、重新安装Discuz；7、检查服务器资源；8、联系Discuz官方支持。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

224

2023.11.20

Golang云原生微服务Kubernetes_Golang怎么集成Kubernetes开发云原生服务

Golang云原生微服务Kubernetes (K8s) 是指使用 Go 语言（Golang）编写的云原生微服务，并利用 Kubernetes 平台进行容器化部署、自动化管理、弹性伸缩和高效编排的一整套现代应用架构方案。

2025.12.22

http500解决方法

http500解决方法有检查服务器日志、检查代码错误、检查服务器配置、检查文件和目录权限、检查资源不足、更新软件版本、重启服务器或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

490

2023.11.09

http请求415错误怎么解决

解决方法：1、检查请求头中的Content-Type；2、检查请求体中的数据格式；3、使用适当的编码格式；4、使用适当的请求方法；5、检查服务器端的支持情况。更多http请求415错误怎么解决的相关内容，可以阅读下面的文章。

448

2023.11.14

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

热门下载

网站特效

网站源码

网站素材

前端模板