0

0

Linux longhorn 的 recurring job 与 volume backup 到 S3 策略

舞姬之光

舞姬之光

发布时间:2026-02-18 14:06:12

|

623人浏览过

|

来源于php中文网

原创

recurring job 未触发 s3 备份,因 longhorn 的 recurring job 仅调用 backup 操作,实际上传依赖 backuptarget 配置、有效凭证、volume 已 attached、s3 权限与 region 匹配,且 backup index 需等待 5 分钟扫描同步。

linux longhorn 的 recurring job 与 volume backup 到 s3 策略

recurring job 为什么没触发 backup 到 S3?

Longhorn 的 recurring job 本身不直接上传备份,它只负责调用 backupsnapshot 操作;真正传到 S3 是靠 volume 的 backup target 配置和 backup store 的可用性驱动的。

  • 必须在 Longhorn UI 的 Settings → Backup Settings 中正确填写 BackupTarget(如 s3://longhorn-backup@cn-north-1/)且 BackupTargetCredentialSecret 存在并有效
  • recurring job 类型选 backup,不是 snapshot——后者只存本地,不会走 S3
  • volume 必须处于 attached 状态(即被 workload 使用中或已手动 attach),detached volume 的 backup 会被跳过
  • 检查 longhorn-manager 日志:kubectl logs -n longhorn-system $(kubectl get pod -n longhorn-system -l app=longhorn-manager -o jsonpath='{.items[0].metadata.name}') | grep -i "backup\|s3",常见错误如 Failed to list backups in s3InvalidAccessKeyId

backup 失败时 S3 目录里只有 .lock 文件

这是典型的 backup 过程中断后残留的锁文件,说明 backup worker 启动了但没完成写入。S3 上出现 .lock 而无对应 .json.img,基本等于这次 backup 已失败,不能手动清理后“续传”。

  • 先确认 S3 bucket 权限:Longhorn 需要 s3:GetObjects3:PutObjects3:ListBuckets3:DeleteObject —— 少一个都可能卡在 lock 阶段
  • 检查 backup target URL 中 region 是否匹配实际 bucket 所在区域,例如 @us-east-1 写成 @us-west-2 会导致签名失败,日志里常出现 AuthorizationHeaderMalformed
  • 网络超时也容易导致 lock 残留:Longhorn 默认 backup 超时是 2 小时,大 volume(>100Gi)在慢网或高延迟 S3 endpoint 下建议调大 BackupTimeoutHour 设置
  • 手动删 .lock 文件没用,得进 Longhorn UI 对该 volume 点击 Remove all backups(会同步清理 S3 中已成功上传的部分),再重试 recurring job

多个 recurring job 共享同一个 backup target 会冲突吗?

不会自动冲突,但存在隐式竞争:所有 backup 操作共享同一套 S3 client 和 credential,底层共用同一个 BackupTarget 配置,所以不是“隔离的”。问题出在并发控制和命名上。

LOGO.com
LOGO.com

在线生成Logo,100%免费

下载
  • Longhorn 不限制并发 backup,如果两个 recurring job 在相近时间触发,可能同时往同一个 S3 prefix 写文件,虽有对象级锁,但易触发 S3 429 Too Many Requests(尤其用 MinIO 或某些国产 S3 兼容层)
  • backup 名称由 Longhorn 自动生成(形如 backup-bcdef123-4567-89ab-cdef-1234567890ab),不支持自定义前缀,因此无法靠路径隔离不同 job 的输出
  • 更稳妥的做法是:为不同业务 volume 分配不同 backup target URL(比如用子目录区分:s3://backups@region/prod-db/ vs s3://backups@region/staging-app/),靠 S3 路径实现逻辑隔离
  • 避免把 backup 和 snapshot recurring job 绑定到同一个 volume —— backup 依赖 snapshot,如果 snapshot job 频率太高,可能因 snapshot chain 过长拖慢 backup 创建

backup 到 S3 后,restore 时提示 “backup doesn’t exist”

这不是 restore 命令的问题,而是 backup index 没同步到 local cache,Longhorn manager 每 5 分钟主动 scan 一次 S3 获取 backup 列表;如果刚 backup 完就立刻 restore,大概率查不到。

  • 等 5–10 分钟再试,或手动触发 scan:kubectl -n longhorn-system exec deploy/longhorn-manager -- longhorn backup ls --volume test-vol
  • 确认 backup target 的 endpoint 可访问:从 longhorn-manager pod 内 curl 测试,比如 curl -v https://s3.cn-north-1.amazonaws.com.cn/longhorn-backup/?prefix=test-vol,注意 S3 兼容服务可能需要关闭 TLS 验证或指定 CA
  • restore 时必须指定完整 backup ID(不是名字),ID 在 backup detail 页面或 longhorn backup ls 输出里第一列,格式类似 backup-abcdef12-3456-7890-abcd-ef1234567890
  • 如果用了跨 region 的 S3(比如 backup 存 us-east-1,restore 从 cn-north-1 的集群发起),需确保 backup target URL 中 region 正确,否则 scan 会连错 endpoint

事情说清了就结束。最常卡住的地方其实是 backup target 的 region 和 credential scope 匹配问题,而不是 job 配置本身。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

442

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

544

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

322

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

81

2025.09.10

curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

452

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

181

2023.10.30

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2571

2024.08.16

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1520

2023.06.21

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

561

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 9.3万人学习

Git 教程
Git 教程

共21课时 | 3.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号