0

0

如何处理RAC网卡故障后的恢复_网卡重新激活与Clusterware网络识别

P粉602998670

P粉602998670

发布时间:2026-03-12 18:02:03

|

879人浏览过

|

来源于php中文网

原创

网卡恢复后需手动触发Clusterware网络重发现并校验oifcfg与HAIP配置:先crsctl stop/start crs,再oifcfg setif更新网卡,放行169.254.0.0/16防火墙规则,确保私网MTU一致且cvuqdisk依赖的ASM就绪。

网卡 down 后 crsctl check cluster 显示节点不可达怎么办

oracle rac 的 clusterware 不会自动感知物理网卡重连或驱动重载,哪怕 ifconfigip link show 已显示网卡状态为 up,crsctl 仍可能持续报 “crs-4638: oracle high availability services is online” 但节点间无法通信。根本原因是 clusterware 在启动时读取并缓存了网络配置(尤其是 ocrconfig -showbackup 中记录的网络拓扑),后续不主动 re-scan。

实操建议:

Sora
Sora

Sora是OpenAI发布的一种文生视频AI大模型,可以根据文本指令创建现实和富有想象力的场景。

下载
  • 先确认网卡是否真通:用 ping -I <em>public_ifname</em> <em>other_node_public_ip</em>ping -I <em>private_ifname</em> <em>other_node_private_ip</em> 分别测试,避免只看 UP 状态就误判
  • 强制触发 Clusterware 网络重发现:运行 crsctl stop crs -f(所有节点依次执行,非并行!),再 crsctl start crs;注意不要用 crsctl restart crs,它跳过网络初始化阶段
  • 检查 OCR 中记录的网卡名是否与当前 ip link 输出一致:运行 oifcfg getif,若返回空或旧网卡名(如 eth0 但实际已是 ens192),需先 oifcfg delif -global 清空,再 oifcfg setif -global <em>new_ifname</em>/<em>subnet</em>:public 重新注册

私网网卡恢复后 cvuqdisk 报错或 cluvfy comp nodecon 失败

私网不通是 RAC 最典型的“假活”场景:CRS 进程在跑,VIP 漂移正常,但节点间心跳丢包,最终触发 evictions。而 cvuqdisk(CVU 依赖的共享磁盘校验模块)在私网异常时会反复重试连接,导致 cluvfy 卡住或直接失败。

实操建议:

  • 不要等 cluvfy 自动超时,手动加 -verbose 参数定位卡点:cluvfy comp nodecon -n all -verbose,重点关注输出中 “Checking interface xxx on subnet” 后是否 hang 住
  • 确认私网 MTU 是否一致:RAC 要求所有节点私网接口 MTU 完全相同(通常 1500),用 ip link show <em>priv_if</em> | grep mtu 核对,不一致会导致 ICMP 包被静默丢弃,ping 看似通但 GI 心跳失败
  • cvuqdisk 报 “Unable to open /dev/oracleasm/…” 本质是 ASM 实例未就绪,此时应先查 crsctl stat res -t | grep asm,而非重装 cvuqdisk

ocrcheck 成功但 crsctl stat res -t 显示 ora.cluster_interconnect.haip OFFLINE

HAIP(High Availability IP)是 11.2+ RAC 私网冗余的关键组件,它不依赖物理网卡绑定,而是由 Clusterware 在私网子网上动态分配一个虚拟 IP(如 169.254.x.x)。一旦底层私网接口恢复但 HAIP 未重建,节点间仍无法通信,ora.cluster_interconnect.haip 就会卡在 OFFLINE。

实操建议:

  • 检查 HAIP 子网是否被系统防火墙拦截:RHEL/CentOS 7+ 默认启用 firewalld,需放行 169.254.0.0/16 流量,命令:firewall-cmd --permanent --add-rich-rule='rule family="ipv4" source address="169.254.0.0/16" accept',然后 firewall-cmd --reload
  • 手动触发 HAIP 重建(谨慎):仅当确认私网已通且 oifcfg 正确时,执行 crsctl stop res ora.cluster_interconnect.haip -init,再 crsctl start res ora.cluster_interconnect.haip -init;切勿在私网未通时强启,会加剧脑裂风险
  • 验证 HAIP 是否生效:在任一节点执行 oifcfg getif 应看到类似 eth1 192.168.10.0 global cluster_interconnect,asm,且 ip addr show 中能查到 169.254.x.x 地址

网卡恢复后 VIP 没漂回原节点,或 SCAN VIP 无法解析

VIP 是绑定在网卡上的,网卡 down 期间 VIP 会被移到其他节点;但网卡恢复后,Clusterware 默认不会自动“漂回”,除非该节点重启 CRS 或手动干预。SCAN VIP 则依赖 DNS 或 GNS,网卡故障常伴随本地 /etc/resolv.conf 或 GNS 配置失效。

实操建议:

  • 强制 VIP 回迁(仅限业务低峰):srvctl relocate vip -n <em>target_node</em> -i <em>vip_name</em>;注意 vip_namesrvctl config vip -n <em>node</em> 返回的完整名称(如 rac1-vip),不是 IP
  • SCAN VIP 解析失败优先查本地 DNS 设置:确认 /etc/resolv.conf 中 nameserver 指向的是 GNS 地址(如 192.168.10.254)或外部 DNS,且该 DNS 确实已配置 SCAN 名称的 A 记录(非 CNAME)
  • 临时绕过 DNS 测试:用 nslookup <em>scan_name</em> <em>gns_ip</em> 直接查 GNS,若通但系统解析不通,大概率是 resolv.conf 被 NetworkManager 覆盖,需设 PEERDNS=no 并重启 network 服务

网卡恢复不是终点,Clusterware 对网络状态的“记忆”比操作系统更顽固。最容易被忽略的是 oifcfg 缓存和 HAIP 子网的防火墙策略——这两处不处理,即使 ping 通、ifconfig up,RAC 依然算“半瘫痪”。

Windows激活工具
Windows激活工具

Windows激活工具是正版认证的激活工具,永久激活,一键解决windows许可证即将过期。可激活win7系统、win8.1系统、win10系统、win11系统。下载后先看完视频激活教程,再进行操作,100%激活成功。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1925

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

656

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2395

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

47

2026.01.19

go中interface用法
go中interface用法

本专题整合了go语言中int相关内容,阅读专题下面的文章了解更多详细内容。

78

2025.09.10

oracle清空表数据
oracle清空表数据

当表中的数据不需要时,则应该删除该数据并释放所占用的空间。本专题为大家提供oracle清空表数据的相关文章,帮助大家解决该问题。

271

2023.08.16

Oracle中declare的使用
Oracle中declare的使用

Oracle DECLARE语句是PL/SQL编程语言中用于声明变量、常量、游标或异常的关键字。它的主要作用是在程序中定义这些对象,以便在后续的代码中使用。DECLARE语句的语法简单明了,可以根据需要声明多个对象。通过使用这些声明的对象,可以进行各种操作,如计算、查询数据库、处理异常等 。

221

2023.09.15

oracle怎么分页
oracle怎么分页

实现分页的步骤:1、使用ROWNUM进行分页查询;2、在执行查询之前进行设置分页参数;3、使用"COUNT(*)"函数来获取总行数,并使用"CEIL"函数来向上取整计算总页数;4、在外部查询中使用"WHERE"子句来筛选出特定的行号范围,以实现分页查询。想了解更多oracle怎么分页的文章,可以来阅读本专题先的文章。

245

2023.09.18

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号