如何处理RAC节点启动卡在CSSD状态_Voting Disk读写超时与存储排查

P粉602998670

发布时间：2026-03-17 09:41:03

423人浏览过

来源于php中文网

原创

CSSD卡在Voting Disk读写超时的根本原因是存储I/O在15秒内未响应，导致Oracle判定存储不可达；常见诱因包括多路径错乱、ASM磁盘头损坏或底层存储链路中断未恢复。

为什么 CSSD 卡在 `Voting Disk` 读写超时？

根本原因不是 cssd 本身坏了，而是它反复尝试访问 +asm 或裸设备上的投票盘（voting disk），但每次 i/o 都在 15s 内没返回——oracle 认定存储不可达，就拒绝继续启动。常见诱因是多路径错乱、asm 磁盘头损坏、或底层存储链路（hba/fc/san）临时中断后未恢复心跳。

`crsctl check css` 返回失败但节点没宕机？先看真实状态

这个命令只查本地 CSSD 进程是否存活，不反映投票盘可达性。真正要看的是：

crsctl query css votedisk —— 如果报 ORA-15012: unable to locate file 或直接卡住，说明 Voting Disk 元数据已不可见
ocrcheck -config —— 若也失败，大概率是同一套 ASM 磁盘组（通常是 +OCR）一起挂了
ls -l /dev/oracleasm/disks/ 或 blkid | grep oracleasm —— 检查磁盘设备节点是否存在且权限正确（属主应为 grid:asmadmin）

多路径下 `asmcmd lsdg` 显示磁盘组 `MOUNTED` 但 CSSD 启不来？别信这个假象

ASM 实例能 mount 磁盘组，只代表它能读取磁盘头和 AU 0 的 ASM 元数据；而 CSSD 要求对 Voting Disk 执行持续、低延迟的同步写（比如更新节点心跳时间戳），这比 ASM 挂载严格得多。常见陷阱：

多路径策略设成 round-robin 但某条路径实际断开，I/O 被调度到坏路径上，超时后才切到好路径——CSSD 等不及切换
存储侧开启了 QoS 限速，单次写入超过 500ms，触发 Oracle 默认的 disk_repair_time=14400 误判
udev 规则里用了 SYMLINK+= 但没加 OWNER="grid"，导致 CSSD 以 root 身份打开设备失败（日志里藏在 $GRID_HOME/log/<node>/cssd/ocssd.log 的 Permission denied）

紧急恢复：绕过 Voting Disk 强制启动 CSSD 的风险与操作

仅限排障用，不能长期运行。本质是让当前节点“假装”自己是唯一节点，跳过仲裁流程：

AI改图神器

AI万能图片编辑器，一键抠图，去水印，智能图片美化，照片转漫画，照片变活转视频，图片无损放大，一键背景虚化，位图智能转矢量图

下载

停止所有 CRS：crsctl stop crs -f
用 crsctl start crs -excl -nocrs 启动 CSSD 独占模式（注意参数顺序，-excl 必须在前）
此时 crsctl query css votedisk 会显示 0 个投票盘，crsctl check css 变绿，但集群服务（CRS、OHAS）不会自动拉起
立刻查 ocssd.log 里最近的 IO timeout 对应的设备名（如 /dev/mapper/mpathb），然后针对性修复存储链路

真正麻烦的从来不是怎么绕过去，而是为什么那个设备在 dd if=/dev/zero of=/dev/mapper/mpathb bs=4k count=100 oflag=sync 下都慢过 2s——这说明问题不在 Oracle，而在你没盯紧的那层存储固件或交换机 zone 配置。

立即学习“前端免费学习笔记（深入）”；

相关标签:

if count oracle ocr

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何使用DBMS_REDEFINITION转换包含LOB的分区表_LOB段独立分区与存储映射下一篇：暂无

作者最新文章

Python笛卡尔积怎么求_itertools.product多列表嵌套

2026-03-17 09:33

NumPy条件替换怎么做_np.where(condition, x, y)三元表达式向量化

2026-03-17 09:34

如何在Golang中实现SQLite的加密存储 Go语言SQLCipher集成

2026-03-17 09:34

SQL中LEFT JOIN与INNER JOIN区别_数据取舍原则与场景选择

2026-03-17 09:34

Redis如何清理失效的位置数据_利用ZREM指令删除Geo结构中的坐标点

2026-03-17 09:35

CSS如何使用反选伪类简化选择器

2026-03-17 09:35

宝塔面板下phpMyAdmin登录提示“#1862 密码过期”如何修改？

2026-03-17 09:36

mysql如何配置多线程并行回放类型_mysql slave_parallel_type选择

2026-03-17 09:37

MongoDB中可以使用布尔值或枚举值作为分片键吗_极低基数导致无法分块的严重错误

2026-03-17 09:38

mysql如何管理大批量用户的权限_mysql基于角色的权限模板

2026-03-17 09:38

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

847

2023.08.22

counta和count的区别

Count函数用于计算指定范围内数字的个数，而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

203

2023.11.20

oracle清空表数据

当表中的数据不需要时，则应该删除该数据并释放所占用的空间。本专题为大家提供oracle清空表数据的相关文章，帮助大家解决该问题。

271

2023.08.16

Oracle中declare的使用

Oracle DECLARE语句是PL/SQL编程语言中用于声明变量、常量、游标或异常的关键字。它的主要作用是在程序中定义这些对象，以便在后续的代码中使用。DECLARE语句的语法简单明了，可以根据需要声明多个对象。通过使用这些声明的对象，可以进行各种操作，如计算、查询数据库、处理异常等。

221

2023.09.15

oracle怎么分页

实现分页的步骤：1、使用ROWNUM进行分页查询；2、在执行查询之前进行设置分页参数；3、使用"COUNT(*)"函数来获取总行数，并使用"CEIL"函数来向上取整计算总页数；4、在外部查询中使用"WHERE"子句来筛选出特定的行号范围，以实现分页查询。想了解更多oracle怎么分页的文章，可以来阅读本专题先的文章。

248

2023.09.18

Oracle查看表操作历史记录

查看操作历史记录的方法：1、使用Oracle内置的审计功能，可以记录数据库中发生的各种操作，包括登录、DDL语句、DML语句等；2、使用Oracle日志文件，其中包含了数据库中发生的各种操作，可以通过查看日志文件来获取操作历史记录；3、使用Oracle的Flashback功能，可以查看数据库在某个时间点的操作历史记录；4、使用第三方工具等。本专题还提供其他查看表操作的文章，大家可以免费阅读。

464

2023.09.19

Oracle中RAC的用法

Oracle中RAC的用法：1、通过在多个服务器上运行数据库实例来提供高可用性；2、允许在需要时增加或减少节点数量；3、通过将工作负载分布到多个节点上来实现负载均衡；4、使用共享存储来实现多个节点之间的数据共享；5、允许多个节点同时处理数据库请求，从而实现并行处理；6、提供了透明故障切换功能；7、使用了一些技术来确保数据的一致性；8、提供了管理工具来简化RAC环境的管理和维护。本专题还提供RAC相关的其他文章，大家可以免费阅读。

452

2023.09.19