如何优化RAC的全局缓存融合Cache Fusion_私有网络Interconnect带宽监控

P粉602998670

发布时间：2026-03-14 17:30:12

899人浏览过

来源于php中文网

原创

Interconnect网络真瓶颈在于延迟不均和小包堆积而非带宽饱和；需结合netstat丢包、iftop流量分布、GV$EVENT_HISTOGRAM分桶、ethtool链路速率及交换机flow control等多维度验证。

怎么判断 Interconnect 网络是不是真瓶颈

别一看到 gc cr block receive time 高就急着升级网卡。真实瓶颈往往藏在「延迟不均」和「小包堆积」里，而不是带宽跑满。oracle 的 gv$cluster_interconnects 只告诉你用了哪张网卡，不反映实际负载；gv$sysstat 里 gc cr blocks received 和 gc current blocks received 增速快，但没上下文也白搭。

实操建议：

BiLin AI

免费的多语言AI搜索引擎

下载

用 netstat -s | grep -i "retransmit\|error\|drop" 看内核层丢包/重传——比 Oracle 统计更早暴露问题
运行 iftop -P tcp -f "port 6200 or port 6201"（假设你用的是默认 GCS/GES 端口）抓实时 Interconnect 流量分布，确认是不是某两个节点之间流量压倒性偏高
查 GV$EVENT_HISTOGRAM 中 gc cr block busy 和 gc current block busy 的 1ms/4ms/16ms 分桶，如果 16ms 桶占比突增，大概率是网络抖动或中断延迟，不是带宽不够

用 ifconfig / ethtool 看懂真实带宽利用率

ifconfig 显示的 bytes 是 L2 层字节数，含以太网头、CRC，而 Oracle GC 流量是 TCP 载荷，两者差约 40–60 字节/包。直接拿 ifconfig 的 RX/TX 除以理论带宽算“利用率”，容易误判 15%–20%。

实操建议：

用 ethtool <code>eth2 确认协商速率是 10000baseT/Full 还是降级成 1000baseT/Full——物理链路降速比软件配置错误更常见
对比 cat /proc/net/dev 的 rx_bytes 和 rx_packets，算平均包长：若长期 _gc_read_mostly_locking 更有效
检查 ethtool -S <code>eth2 输出里的 rx_discards、tx_aborted_errors，非零值基本可定位到网卡驱动或交换机 QoS 限速

GC 流量和业务 SQL 的耦合关系怎么验证

Interconnect 压力从来不是孤立存在的。一个 UPDATE /*+ PARALLEL(8) */ 在 RAC 上可能触发 8×N 次 gc current block 请求（N=数据块数），但同样的语句在单实例只走 buffer cache。监控时如果只盯网络，会漏掉真正推手。

实操建议：

开 ALTER SYSTEM SET EVENTS '10046 trace name context forever, level 8'; 在压力时段抓几个 GC 密集会话，看 trace 文件里 WAIT #<code>1: nam='gc current block 2-way' 后紧跟的 SQL —— 往往是未绑定变量的循环 INSERT 或低效 JOIN
查 GV$SQL 中 buffer_gets/executions 高但 disk_reads/executions 低的语句，这类 SQL 内存访问频繁，极易放大 GC 开销
禁用 PARALLEL DML 后观察 gc cr blocks received 是否下降 40%+，能快速验证是否并行度设计失当

为什么改了 MTU 或关闭 checksum 却没改善

Jumbo Frame 不是银弹。Linux 内核默认 tcp_segmentation_offload（TSO）和 generic_receive_offload（GRO）开启状态下，ethtool -K <code>eth2 tso off gro off 才能让抓包看到真实 IP 包大小。否则你调了 MTU=9000，Wireshark 里还是看到 1500 字节的 TCP segment，误以为没生效。

实操建议：

确认所有节点执行：echo 'net.ipv4.tcp_timestamps = 0' >> /etc/sysctl.conf && sysctl -p —— 时间戳字段增加 12 字节/包，在高频小包场景下不可忽视
交换机侧必须同步关闭 flow control（pause frames），否则 Oracle 进程可能被无预警阻塞，表现为 gc cr block lost 等待突增
_gc_policy_time 默认 10 秒，意味着跨节点数据块迁移决策有延迟；若业务对一致性要求极高（如金融账务），设为 2–3 秒可减少等待，但会小幅增加心跳流量

Interconnect 监控最难的不是拿到数字，而是把 gc cr block busy 的毫秒波动、ethtool -S 的丢包计数、SQL 的执行计划三者串成一条因果链——中间任何一环靠猜，优化就变成碰运气。

相关标签:

sql echo Error 循环堆 oracle wireshark linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何配置Data Guard的保护模式在Broker中生效_EDIT DATABASE SET PROPERTY调整模式下一篇：暂无

作者最新文章

悟空浏览器怎么关闭启动时的加载动画闪屏_悟空浏览器秒开优化

2026-03-13 17:04

如何在Golang中通过反射创建并操作切片 Go语言reflect.MakeSlice实战

2026-03-13 17:05

如何避免PL/SQL中的SQL注入_绑定变量Bind Variables的最佳实践

2026-03-13 17:05

Safari浏览器如何关闭网页的安全证书警告_Safari浏览器继续访问

2026-03-13 17:06

宝塔面板下如何安装Node.js的特定版本镜像源？

2026-03-13 17:09

如何在Golang中实现优雅的请求超时控制 Go语言http.TimeoutHandler使用

2026-03-13 17:09

如何在Golang中利用Trace工具分析延迟 Go语言执行链路可视化追踪

2026-03-13 17:09

如何在Golang中利用SQLite进行本地存储 Go语言嵌入式数据库应用

2026-03-13 17:11

如何在Golang中利用Finalizer清理非内存资源 Go语言runtime.SetFinalizer使用

2026-03-13 17:11

如何为Oracle配置多监听器_不同端口的并发监听机制实现

2026-03-13 17:12

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1135

2023.10.12