0

0

Linux 高可用与集群实战教程

冷漠man

冷漠man

发布时间:2026-02-22 19:03:10

|

627人浏览过

|

来源于php中文网

原创

linux高可用集群可靠性的核心是及时故障检测、干净资源切换和杜绝脑裂;常见corosync启动失败因配置校验不通过或通信不通,需检查bindnetaddr、时间同步、防火墙端口;资源unmanaged需手动恢复管控,failed多因启动脚本错误;两节点必须配置qdevice防脑裂;亚健康状态下的决策鲁棒性才是最大挑战。

linux 高可用与集群实战教程

Linux 高可用集群不是装几个软件就能跑起来的,核心在于故障检测是否及时、资源切换是否干净、脑裂是否被杜绝——这三件事没理清,服务反而比单机更不可靠。

pacemaker + corosync 启动失败,日志里反复出现 corosync[xxxx]: [MAIN ] Corosync Cluster Engine exited with status 8

这是最常见的“启动即退出”问题,根本原因通常是 corosync 配置未通过校验或底层通信不通。pacemaker 依赖 corosync 正常运行,它一挂,整个集群就停摆。

  • 先检查 /etc/corosync/corosync.conf 是否能被 corosync-cfgtool -s 解析成功;常见错误是 totem.interface.bindnetaddr 写成了具体 IP 而非网段(比如填 192.168.1.10 而不是 192.168.1.0
  • 确认所有节点时间同步:chronyc tracking 输出的 offset 应小于 50ms,否则 corosync 拒绝加入集群
  • 防火墙必须放行 udp/5404-5405(corosync 默认端口),用 ss -uln | grep ':540' 验证端口是否真在监听

crm configure 命令添加资源后,pcs status 显示 unmanagedfailed

资源状态异常不等于配置写错了,而是 pacemaker 尚未尝试启动它,或启动后立刻崩溃。关键看 pcs resource debug-start <resource-id></resource-id> 的实时输出。

PHPB2B
PHPB2B

PHP-B2B(原友邻b2b)是一套能够帮助用户,快速建立高效、多功能电子商务网站的php应用程序,本程序采用目前互联网上最流行的LAMP组合(Linux+Apache+Mysql+PHP)开发完成,同时利用Smarty模板技术实现了网站前台与后台的有效分离,用户可以快速地在此基础上开发自己的模板。 友邻php提供了电子商务应用最常见求购、供应、商品、公司库等模块,同时为企业用户提供了一个发布信

下载
  • unmanaged 表示该资源被手动禁用(pcs resource unmanage <id></id>),需执行 pcs resource manage <id></id> 恢复自动管控
  • failed 多因启动脚本返回非零码,比如 systemd 类资源依赖的 service 文件不存在,或 ocf:heartbeat:IPaddr2ip 参数格式错误(应为 192.168.1.100/24,不能漏掉掩码)
  • 避免直接改 crm configure 的 raw 文本,用 pcs resource update <id> param=value</id> 更安全,否则语法错会导致整个 CIB 提交失败

两个节点都声称自己是 master,VIP 在两边同时响应(脑裂)

这不是配置遗漏,而是仲裁机制失效的典型表现。corosync 默认只做通信心跳,不判断“谁该活”,必须显式配置 qdevice 或至少一个 quorum device

  • 两节点集群必须启用 qdevice(如基于 qnetd 的仲裁服务器),否则默认 two_node: 1 实际上是危险模式:只要网络抖动,两边都会认为对方失联而抢资源
  • 检查 pcs quorum status,若显示 Quorum: No,说明当前没有法定票数,所有资源会被强制停止
  • 不要用 ping 节点作为仲裁手段(ocf:pacemaker:ping),它无法区分网络分区和真实宕机,极易引发误切

真正难的不是加机器、配资源,是让集群在丢包、时钟漂移、磁盘卡顿这些“亚健康”状态下依然拒绝错误决策。很多线上事故,都发生在 corosync 心跳延迟刚超阈值但还没断连的那几秒里——那里没日志,也没告警,只有沉默的 VIP 漂移。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
resource是什么文件
resource是什么文件

Resource文件是一种特殊类型的文件,它通常用于存储应用程序或操作系统中的各种资源信息。它们在应用程序开发中起着关键作用,并在跨平台开发和国际化方面提供支持。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

169

2023.12.20

go中interface用法
go中interface用法

本专题整合了go语言中int相关内容,阅读专题下面的文章了解更多详细内容。

77

2025.09.10

tcp和udp的区别
tcp和udp的区别

TCP和UDP的区别,在连接性、可靠性、速度和效率、数据报大小以及适用场景等方面。本专题为大家提供tcp和udp的区别的相关的文章、下载、课程内容,供大家免费下载体验。

123

2023.07.25

udp是什么协议
udp是什么协议

UDP是OSI参考模型中一种无连接的传输层协议。本专题为大家带来udp是什么协议的相关文章,免费提供给大家。

301

2023.08.08

tcp和udp有什么区别
tcp和udp有什么区别

tcp和udp的区别有:1、udp是无连接的,tcp是面向连接的;2、udp是不可靠传输,tcp是可靠传输;3、udp是面向报文传输,tcp是面向字节流传输。想了解更多tcp相关的内容,可阅读本专题下面的相关文章。

396

2024.11.14

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1520

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

715

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

300

2023.06.30

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1030

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 9.5万人学习

Git 教程
Git 教程

共21课时 | 3.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号