0

0

如何解决脑裂问题_Split Brain机制与表决磁盘踢出节点原理

P粉602998670

P粉602998670

发布时间:2026-03-19 07:31:17

|

959人浏览过

|

来源于php中文网

原创

脑裂问题只能预防,不能修复——通过投票磁盘法定人数机制强制隔离故障节点;Oracle RAC依据节点对多数投票磁盘的访问能力(而非心跳顺序)决定驱逐对象,由CSS自动执行。

脑裂问题不能“修复”,只能“预防”——一旦发生,数据冲突已成事实,所谓“解决”其实是靠提前设计的表决机制,在网络断开的瞬间就强制让一部分节点停止服务,不给写入机会。

为什么投票磁盘(voting disk)能决定踢谁?

Oracle RAC 不靠“谁先心跳断”来判断故障,而是看谁能访问到多数投票磁盘。每个节点持续向所有投票磁盘写入“心跳块”(称为 disk heartbeat),同时读取其他节点留下的最新时间戳。当私网中断,集群分裂成两组时:

  • 节点数多的一组,大概率能访问到 ≥(N/2)+1 个投票磁盘,满足 Quorum,继续运行
  • 节点数少或磁盘路径受损的一组,读不到足够数量的、新鲜的心跳块,被判定为“失去法定人数”,立即触发 eviction
  • 注意:不是“投票选谁滚”,而是“谁达不到法定访问能力,谁就被踢”——踢出动作由 CSS(Cluster Synchronization Services)自动触发,无需人工干预

crsctl get css misscount 超时值设太小反而更危险

这个值(默认 30)不是“容忍断连多久”,而是“允许连续丢失多少次磁盘心跳”。它和实际网络抖动强相关:

  • 设成 10:轻微丢包就可能触发误驱逐,尤其在高负载、I/O 延迟波动大的存储环境
  • 设成 60:虽降低误判,但若真发生严重网络分区,错误节点会多活 30 秒,极大增加脏写风险
  • 真实建议:保持默认 30,但必须配合稳定的多路径存储(如 multipath + ALUA),避免单条路径抖动被误判为磁盘不可达

偶数节点 RAC 必须加仲裁盘(Quorum Device)

2 节点 RAC 是最危险配置:网络一断,必然 1:1 分裂,两边都刚好能访问 1 个投票磁盘(假设共 2 个),谁都凑不够多数。此时仅靠磁盘心跳无法打破平局:

上班人导航
上班人导航

上班人必备的职场办公导航网站

下载
  • 必须引入第三方仲裁设备(如 NFS 共享文件、ASM Flex Diskgroup 中的 quorum failgroup)作为“第 3 票”
  • 该设备不存业务数据,只参与心跳计票;它和两个节点之间需有独立、低延迟的网络路径(不能走同一交换机)
  • 切忌用管理网挂 NFS 仲裁盘——管理网一旦和私网共用物理链路,仲裁路径和心跳路径就耦合了,等于没加

真正难的不是配置投票磁盘,而是验证它在各种故障组合下是否真能按预期工作。比如模拟私网断+某条存储路径断+节点高负载,这时候 CSS 日志里 evicting node X due to loss of voting disk connectivity 是否准时出现,比任何文档都管用。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
oracle清空表数据
oracle清空表数据

当表中的数据不需要时,则应该删除该数据并释放所占用的空间。本专题为大家提供oracle清空表数据的相关文章,帮助大家解决该问题。

271

2023.08.16

Oracle中declare的使用
Oracle中declare的使用

Oracle DECLARE语句是PL/SQL编程语言中用于声明变量、常量、游标或异常的关键字。它的主要作用是在程序中定义这些对象,以便在后续的代码中使用。DECLARE语句的语法简单明了,可以根据需要声明多个对象。通过使用这些声明的对象,可以进行各种操作,如计算、查询数据库、处理异常等 。

222

2023.09.15

oracle怎么分页
oracle怎么分页

实现分页的步骤:1、使用ROWNUM进行分页查询;2、在执行查询之前进行设置分页参数;3、使用"COUNT(*)"函数来获取总行数,并使用"CEIL"函数来向上取整计算总页数;4、在外部查询中使用"WHERE"子句来筛选出特定的行号范围,以实现分页查询。想了解更多oracle怎么分页的文章,可以来阅读本专题先的文章。

248

2023.09.18

Oracle查看表操作历史记录
Oracle查看表操作历史记录

查看操作历史记录的方法:1、使用Oracle内置的审计功能,可以记录数据库中发生的各种操作,包括登录、DDL语句、DML语句等;2、使用Oracle日志文件,其中包含了数据库中发生的各种操作,可以通过查看日志文件来获取操作历史记录;3、使用Oracle的Flashback功能,可以查看数据库在某个时间点的操作历史记录;4、使用第三方工具等。本专题还提供其他查看表操作的文章,大家可以免费阅读。

464

2023.09.19

Oracle中RAC的用法
Oracle中RAC的用法

Oracle中RAC的用法:1、通过在多个服务器上运行数据库实例来提供高可用性;2、允许在需要时增加或减少节点数量;3、通过将工作负载分布到多个节点上来实现负载均衡;4、使用共享存储来实现多个节点之间的数据共享;5、允许多个节点同时处理数据库请求,从而实现并行处理;6、提供了透明故障切换功能;7、使用了一些技术来确保数据的一致性;8、提供了管理工具来简化RAC环境的管理和维护。本专题还提供RAC相关的其他文章,大家可以免费阅读。

454

2023.09.19

oracle imp
oracle imp

imp是Oracle数据库中的一个命令行工具,用于将导出的数据和对象从一个数据库实例导入到另一个数据库实例。imp命令的一般语法为“imp username/password@connect_string file=file_name [options]”。

343

2023.09.19

常用的数据库软件
常用的数据库软件

常用的数据库软件有MySQL、Oracle、SQL Server、PostgreSQL、MongoDB、Redis、Cassandra、Hadoop、Spark和Amazon DynamoDB。更多关于数据库软件的内容详情请看本专题下面的文章。php中文网欢迎大家前来学习。

1011

2023.11.02

oracle通配符有哪些
oracle通配符有哪些

oracle通配符有“%”、“_”、“[]”和“[^]"。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

166

2023.11.08

Python WebSocket实时通信与异步服务开发实践
Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践,系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例,帮助开发者构建高效稳定的实时通信系统,适用于聊天应用、实时数据推送等场景。

7

2026.03.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号