0

0

如何分析AWR中的等待事件_Top 10 Foreground Events解读

P粉602998670

P粉602998670

发布时间:2026-03-18 10:37:33

|

518人浏览过

|

来源于php中文网

原创

Top 5 Timed Events 是性能诊断起点,反映数据库时间消耗分布;需结合等待次数、平均等待时间、业务上下文及底层指标(如IO延迟、RAC互连状态)综合判断真瓶颈,而非孤立解读事件名称。

Top 5 Timed Events 是性能诊断的起点,不是终点

awr报告里最该先看的,就是 top 5 timed events ——它不是“发生了什么”,而是“数据库时间被谁吃掉了最多”。占比高 ≠ 问题大,但它是唯一能快速过滤噪音的入口。

常见错误是盯着“db file sequential read”就去调索引,结果发现是归档日志写满导致LGWR卡住,连带拖慢所有单块读;或者看到“CPU time”排第一,却没往下翻到 SQL ordered by CPU Time,直接去加CPU,而实际是一条没走索引的报表SQL在刷全表。

  • 必须结合等待次数(Waits)和平均等待时间(Avg Wait ms)一起看:比如 log file sync 平均 896 µs 看似很短,但若 1 小时内发生 140 万次,说明提交太密,不是IO慢,是应用层事务粒度太细
  • 注意并发基数:10个用户触发 50 万次 gc buffer busy acquire,比 1000 个用户触发 50 万次严重得多——前者大概率是热点块,后者可能是正常RAC流量
  • 跳过空闲事件:SQL*Net message from client 属于空闲等待,只要不占 Top 5,基本不用管;真要查网络问题,得看 SQL*Net more data to client 或超时类事件

IO类等待怎么区分“真瓶颈”和“假警报”

db file scattered readdb file sequential read 都是物理读,但背后原因天差地别。不能一见“read”就查磁盘,得先问:这读是必要的吗?

比如 OLTP 系统里 db file scattered read 占 Top 2,十有八九是某张小表被频繁全扫——可能因为缺失索引,也可能因为优化器觉得走索引更贵(optimizer_index_cost_adj 设太高),甚至只是开发写了 SELECT * 却忘了加 WHERE。

  • 查是否真IO慢:去报告末尾的 Tablespace IO Stats 看对应表空间的 Avg Rd(ms),持续 >20ms 才算磁盘响应慢;如果只有 3ms,那问题在SQL逻辑,不在存储
  • 查是不是被逼的:用 v$session_longops 找出正在跑的长操作,看是不是某条SQL在做全表扫描;再用 DBA_HIST_SQLSTAT 对比历史执行计划,确认是不是最近才变慢
  • 别忽略 direct path read:它不走Buffer Cache,常出现在排序、Hash Join、并行查询中。如果它突然飙升,优先查 PGA_AGGREGATE_TARGET 是否够用,而不是急着调SGA

RAC环境下的等待事件要绑定互连和实例状态看

RAC不是“多台Oracle叠在一起”,GC(Global Cache)相关的等待事件,本质是节点间协调成本。单独看数字毫无意义,必须和集群健康度交叉验证。

比如 gc cr block lost 平均等待 1.15 秒,表面是块丢了,但真实原因可能是私网丢包、心跳超时、或某个实例已hang住但还没被驱逐——此时只调参数没用,得先登录各节点查 crsctl check crsoifcfg getif

医真AI+开放平台
医真AI+开放平台

医真AI+ 医学AI开放平台

下载
  • gc current grant busy 次数高 + gc buffer busy acquire 时间长 → 往往是同一数据块被多个实例高频修改,典型如序列号表、计数器字段;解决方向是拆分热点(如用hash分区)、改用序列缓存,而非加buffer cache
  • gc cr multi block mixed 出现多但平均时间短(如 4.54ms)→ 更可能是CR请求模式变化(比如新上线一个报表用了大量并行),先确认业务变更,再决定是否调 _gc_read_mostly_locking
  • 所有GC类等待都高于 0.1% 时,必须同步检查 GV$CLUSTER_INTERCONNECTS 的吞吐和延迟,以及 netstat -s | grep "retrans" 看TCP重传率

log file sync 高了,别只盯着磁盘IO

log file sync 等待高,90%的人第一反应是“把redo log放SSD上”,但真正根因常在别处:LGWR写得慢,未必是磁盘慢,可能是它根本没被及时唤醒,或者被其他进程堵住了。

比如 _log_io_size 默认 1MB,如果业务每秒只产生 200KB redo,LGWR 3 秒才刷一次,commit 就得等满 3 秒;又比如 RAC 私网延迟高,LGWR 在等其他节点的确认,也会拖长单次 sync 时间。

  • 先看等待次数:如果每秒 commit 超过 500 次,即使磁盘再快也扛不住——这是应用层问题,得推动业务方合并事务或用批量提交
  • 查LGWR状态:在 ASH 里搜 event = 'log file sync' 的会话,看它们的 blocking_session 是不是指向 LGWR;再查 LGWR 自己在等什么(常是 log file parallel writegc cr block busy
  • 参数级干预要谨慎:commit_logging= BATCH 可降低 sync 频次,但牺牲持久性;commit_wait= NOWAIT 跳过等待,但应用需自行处理可能丢失的提交——这些不是诊断手段,是兜底方案

真正难的不是识别哪个等待事件高,而是判断这个高,是系统在“喊疼”,还是它本来就这样工作。AWR 报告不会告诉你答案,它只负责把时间账本摊开给你看——剩下的,得你带着业务上下文去对账。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

1135

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

340

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

381

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

2278

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

380

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1764

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

588

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

441

2024.04.29

Python WebSocket实时通信与异步服务开发实践
Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践,系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例,帮助开发者构建高效稳定的实时通信系统,适用于聊天应用、实时数据推送等场景。

2

2026.03.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号