如何处理RAC网卡故障后的恢复_网卡重新激活与Clusterware网络识别

P粉602998670

发布时间：2026-03-12 18:02:03

879人浏览过

来源于php中文网

原创

网卡恢复后需手动触发Clusterware网络重发现并校验oifcfg与HAIP配置：先crsctl stop/start crs，再oifcfg setif更新网卡，放行169.254.0.0/16防火墙规则，确保私网MTU一致且cvuqdisk依赖的ASM就绪。

网卡 down 后 `crsctl check cluster` 显示节点不可达怎么办

oracle rac 的 clusterware 不会自动感知物理网卡重连或驱动重载，哪怕 ifconfig 或 ip link show 已显示网卡状态为 up，crsctl 仍可能持续报 “crs-4638: oracle high availability services is online” 但节点间无法通信。根本原因是 clusterware 在启动时读取并缓存了网络配置（尤其是 ocrconfig -showbackup 中记录的网络拓扑），后续不主动 re-scan。

实操建议：

Sora

Sora是OpenAI发布的一种文生视频AI大模型，可以根据文本指令创建现实和富有想象力的场景。

下载

先确认网卡是否真通：用 ping -I public_ifname other_node_public_ip 和 ping -I private_ifname other_node_private_ip 分别测试，避免只看 UP 状态就误判
强制触发 Clusterware 网络重发现：运行 crsctl stop crs -f（所有节点依次执行，非并行！），再 crsctl start crs；注意不要用 crsctl restart crs，它跳过网络初始化阶段
检查 OCR 中记录的网卡名是否与当前 ip link 输出一致：运行 oifcfg getif，若返回空或旧网卡名（如 eth0 但实际已是 ens192），需先 oifcfg delif -global 清空，再 oifcfg setif -global new_ifname/subnet:public 重新注册

私网网卡恢复后 `cvuqdisk` 报错或 `cluvfy comp nodecon` 失败

私网不通是 RAC 最典型的“假活”场景：CRS 进程在跑，VIP 漂移正常，但节点间心跳丢包，最终触发 evictions。而 cvuqdisk（CVU 依赖的共享磁盘校验模块）在私网异常时会反复重试连接，导致 cluvfy 卡住或直接失败。

实操建议：

不要等 cluvfy 自动超时，手动加 -verbose 参数定位卡点：cluvfy comp nodecon -n all -verbose，重点关注输出中 “Checking interface xxx on subnet” 后是否 hang 住
确认私网 MTU 是否一致：RAC 要求所有节点私网接口 MTU 完全相同（通常 1500），用 ip link show priv_if | grep mtu 核对，不一致会导致 ICMP 包被静默丢弃，ping 看似通但 GI 心跳失败
cvuqdisk 报 “Unable to open /dev/oracleasm/…” 本质是 ASM 实例未就绪，此时应先查 crsctl stat res -t | grep asm，而非重装 cvuqdisk

`ocrcheck` 成功但 `crsctl stat res -t` 显示 `ora.cluster_interconnect.haip` OFFLINE

HAIP（High Availability IP）是 11.2+ RAC 私网冗余的关键组件，它不依赖物理网卡绑定，而是由 Clusterware 在私网子网上动态分配一个虚拟 IP（如 169.254.x.x）。一旦底层私网接口恢复但 HAIP 未重建，节点间仍无法通信，ora.cluster_interconnect.haip 就会卡在 OFFLINE。

实操建议：

检查 HAIP 子网是否被系统防火墙拦截：RHEL/CentOS 7+ 默认启用 firewalld，需放行 169.254.0.0/16 流量，命令：firewall-cmd --permanent --add-rich-rule='rule family="ipv4" source address="169.254.0.0/16" accept'，然后 firewall-cmd --reload
手动触发 HAIP 重建（谨慎）：仅当确认私网已通且 oifcfg 正确时，执行 crsctl stop res ora.cluster_interconnect.haip -init，再 crsctl start res ora.cluster_interconnect.haip -init；切勿在私网未通时强启，会加剧脑裂风险
验证 HAIP 是否生效：在任一节点执行 oifcfg getif 应看到类似 eth1 192.168.10.0 global cluster_interconnect,asm，且 ip addr show 中能查到 169.254.x.x 地址

网卡恢复后 VIP 没漂回原节点，或 SCAN VIP 无法解析

VIP 是绑定在网卡上的，网卡 down 期间 VIP 会被移到其他节点；但网卡恢复后，Clusterware 默认不会自动“漂回”，除非该节点重启 CRS 或手动干预。SCAN VIP 则依赖 DNS 或 GNS，网卡故障常伴随本地 /etc/resolv.conf 或 GNS 配置失效。

实操建议：

强制 VIP 回迁（仅限业务低峰）：srvctl relocate vip -n target_node -i vip_name；注意 vip_name 是 srvctl config vip -n node 返回的完整名称（如 rac1-vip），不是 IP
SCAN VIP 解析失败优先查本地 DNS 设置：确认 /etc/resolv.conf 中 nameserver 指向的是 GNS 地址（如 192.168.10.254）或外部 DNS，且该 DNS 确实已配置 SCAN 名称的 A 记录（非 CNAME）
临时绕过 DNS 测试：用 nslookup scan_name gns_ip 直接查 GNS，若通但系统解析不通，大概率是 resolv.conf 被 NetworkManager 覆盖，需设 PEERDNS=no 并重启 network 服务

网卡恢复不是终点，Clusterware 对网络状态的“记忆”比操作系统更顽固。最容易被忽略的是 oifcfg 缓存和 HAIP 子网的防火墙策略——这两处不处理，即使 ping 通、ifconfig up，RAC 依然算“半瘫痪”。

Windows激活工具

Windows激活工具是正版认证的激活工具，永久激活，一键解决windows许可证即将过期。可激活win7系统、win8.1系统、win10系统、win11系统。下载后先看完视频激活教程，再进行操作，100%激活成功。

下载

相关专题

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

1925

2023.10.19

PHP接口编写教程

本专题整合了PHP接口编写教程，阅读专题下面的文章了解更多详细内容。

656

2025.10.17

php8.4实现接口限流的教程

PHP8.4本身不内置限流功能，需借助Redis（令牌桶）或Swoole（漏桶）实现；文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

2395

2025.12.29

java接口相关教程

本专题整合了java接口相关内容，阅读专题下面的文章了解更多详细内容。

2026.01.19

go中interface用法

本专题整合了go语言中int相关内容，阅读专题下面的文章了解更多详细内容。

2025.09.10

oracle清空表数据

当表中的数据不需要时，则应该删除该数据并释放所占用的空间。本专题为大家提供oracle清空表数据的相关文章，帮助大家解决该问题。

271

2023.08.16

Oracle中declare的使用

Oracle DECLARE语句是PL/SQL编程语言中用于声明变量、常量、游标或异常的关键字。它的主要作用是在程序中定义这些对象，以便在后续的代码中使用。DECLARE语句的语法简单明了，可以根据需要声明多个对象。通过使用这些声明的对象，可以进行各种操作，如计算、查询数据库、处理异常等。

221

2023.09.15

oracle怎么分页

实现分页的步骤：1、使用ROWNUM进行分页查询；2、在执行查询之前进行设置分页参数；3、使用"COUNT(*)"函数来获取总行数，并使用"CEIL"函数来向上取整计算总页数；4、在外部查询中使用"WHERE"子句来筛选出特定的行号范围，以实现分页查询。想了解更多oracle怎么分页的文章，可以来阅读本专题先的文章。

245

2023.09.18

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板